KR20190000776A - Information inputting method - Google Patents

Information inputting method Download PDF

Info

Publication number
KR20190000776A
KR20190000776A KR1020180014324A KR20180014324A KR20190000776A KR 20190000776 A KR20190000776 A KR 20190000776A KR 1020180014324 A KR1020180014324 A KR 1020180014324A KR 20180014324 A KR20180014324 A KR 20180014324A KR 20190000776 A KR20190000776 A KR 20190000776A
Authority
KR
South Korea
Prior art keywords
phrase
identification
word
pinyin
user
Prior art date
Application number
KR1020180014324A
Other languages
Korean (ko)
Other versions
KR102046486B1 (en
Inventor
민후 판
Original Assignee
베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. filed Critical 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디.
Publication of KR20190000776A publication Critical patent/KR20190000776A/en
Application granted granted Critical
Publication of KR102046486B1 publication Critical patent/KR102046486B1/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Telephonic Communication Services (AREA)

Abstract

Disclosed is a method for inputting information. According to one specific embodiment of the present invention, the method comprises the steps of: receiving voice information input by a user; transmitting the voice information to a server, and receiving identification phrases and pinyin which are transmitted from the server; searching words corresponding to the pinyin in a predetermined lexicon, and replacing words having smaller certainty factors than a critical value among identification phrases with the searched words corresponding to the pinyin in order to obtain jointing phrases; and according to a comparison result of a weight corresponding to the jointing phrase and a weight corresponding to identification phrases, confirming a candidate result displayed for a user. The identification phrase is obtained by executing voice identification for the voice information, and the pinyin is a pinyin of a word having a smaller certainty factor than a critical value among words disassembled from the identification phrases obtained by executing the voice identification for the voice information. The present invention precisely identifies words such as a word created by the user among voice input by a user into an input device, and provides a precise candidate result for the user in voice inputs of the input device.

Description

정보 입력 방법{INFORMATION INPUTTING METHOD}INFORMATION INPUTING METHOD

본 출원은 컴퓨터 분야에 관한 것으로서, 구체적으로는 입력기 분야에 관한 것이며, 특히 정보 입력 방법에 관한 것이다.This application relates to the field of computers, specifically to the field of input devices, and more particularly to information input methods.

현재, 일부 입력기에 있어서, 사용자에게 음성 입력 기능을 제공한다. 사용자가 음성 정보를 입력한 후, 사용자에게 표시하는 후보 결과는 서버가 음성 정보에 대하여 음성 식별을 실행한 후의 통용 결과이다.Currently, for some input devices, the user is provided with a voice input function. The candidate result to be displayed to the user after the user inputs the voice information is a common result after the server performs voice identification on the voice information.

하지만, 부동한 사용자가 사용하는 단어의 개성화 특징을 고려하지 않았기 때문에, 사용자가 입력한 음성 중에서 사용자의 창작어와 같은 단어를 정확하게 식별할 수 없으며, 입력기의 음성 입력에 있어서 사용자에게 정확한 후보 결과를 제공할 수 없게 된다.However, since it does not take into consideration the individualization characteristics of words used by different users, it is impossible to correctly identify words such as a user's original word among user-input voices, and provides accurate candidate results to the user in voice input of the input device I can not do it.

한국공개특허 제10-2009-0129192호Korean Patent Laid-Open No. 10-2009-0129192

본 출원은 상기 배경 기술 부분에 존재하는 기술 문제를 해결하기 위한 정보 입력 방법을 제공한다.The present application provides an information input method for solving a technical problem existing in the background art part.

본 출원은 정보 입력 방법을 제공하며, 당해 방법은 사용자가 입력한 음성 정보를 수신하는 단계; 상기 음성 정보를 서버에 송신하고, 서버로부터 송신된 식별 문구와 병음을 수신하는 단계; 사전에 마련된의 렉시콘에서 상기 병음에 대응하는 단어를 검색하고, 식별 문구 중의 상기 확신도가 임계값보다 낮은 단어를 검색된 상기 병음에 대응하는 단어로 대체하여 조인팅 문구를 얻는 단계; 및 상기 조인팅 문구에 대응하는 가중과 식별 문구에 대응하는 가중의 비교 결과에 따라, 사용자에게 표시하는 후보 결과를 확정하는 단계를 포함하되, 여기서 상기 식별 문구는 상기 음성 정보에 대하여 음성 식별을 실행하여 얻고, 상기 병음은 상기 음성 정보에 대하여 음성 식별을 실행하여 얻은 식별 문구를 분해한 단어 중 확신도가 임계값보다 낮은 단어의 병음이다.The present application provides a method of inputting information, the method comprising: receiving voice information input by a user; Transmitting the voice information to a server, receiving an identification phrase transmitted from a server and a pinyin; Retrieving a word corresponding to the pinyin from a dictionary prepared in advance and replacing the word having a degree of assurance lower than a threshold value in the identification phrase with a word corresponding to the retrieved pinyin to obtain a joining phrase; And determining a candidate result to be displayed to a user according to a result of weighting corresponding to the joining phrase and weighting corresponding to the identification phrase, wherein the identification phrase performs voice identification for the voice information , And the Pinyin is a Pinyin word of a word whose degree of assurance is lower than a threshold value among words obtained by decomposing an identification phrase obtained by performing voice recognition on the voice information.

본 출원은 정보 입력 방법을 제공하며, 당해 방법은 단말기로부터 송신된 음성 정보를 수신하는 단계; 상기 음성 정보에 대하여 음성 식별을 실행하여 식별 문구를 얻고, 상기 식별 문구를 분해하여 복수의 단어를 얻는 단계; 및 상기 복수의 단어 중 확신도가 임계값보다 낮은 단어를 확정하고, 식별 문구와 확정된 단어의 병음을 단말기에 송신하는 단계를 포함한다.The present application provides an information input method, comprising the steps of: receiving voice information transmitted from a terminal; Performing voice identification on the voice information to obtain an identification phrase, and decomposing the identification phrase to obtain a plurality of words; And determining a word having a degree of assurance lower than a threshold value among the plurality of words, and transmitting an identification phrase and a pinyin of the determined word to the terminal.

본 출원에 따른 정보 입력 방법에 있어서, 사용자가 입력한 음성 정보를 수신하며, 음성 정보를 서버에 송신하고, 서버로부터 송신된 식별 문구와 병음을 수신하며, 즉 음성 정보에 대하여 음성 식별을 실행하여 얻은 식별 문구와 음성 정보에 대하여 음성 식별을 실행하여 얻은 식별 문구를 분해한 단어 중 확신도가 임계값보다 낮은 단어의 병음을 수신하며, 사전에 마련된의 렉시콘에서 병음에 대응하는 단어를 검색하고, 식별 문구 중의 확신도가 임계값보다 낮은 단어를 검색된 병음에 대응하는 단어로 대체하여 조인팅 문구를 얻으며, 조인팅 문구에 대응하는 가중과 식별 문구에 대응하는 가중의 비교 결과에 따라, 사용자에게 표시하는 후보 결과를 확정하는 것을 통하여, 사용자가 입력기에 입력한 음성 중의 예를 들면 사용자의 창작어와 같은 단어를 정확하게 식별하며, 입력기의 음성 입력에 있어서 사용자에게 정확한 후보 결과를 제공하는 것을 실현한다.According to the present invention, there is provided an information input method comprising: receiving voice information input by a user; transmitting voice information to a server; receiving an identification phrase transmitted from a server and a pinyin; A word corresponding to the pinyin is retrieved from the Lexicon provided in advance, and the word corresponding to the pinyin is retrieved from the Lexicon prepared in advance, A word having a degree of assurance lower than a threshold value in the identification phrase is replaced with a word corresponding to the searched pinyin to obtain a joining phrase, and the user is informed of the weighting corresponding to the joining phrase and the weight corresponding to the identification phrase, The user can select one of the voices input by the user to the input unit, for example, And to provide the correct candidate result to the user in the speech input of the input device.

본 출원의 기타 특징, 목적 및 이점은 아래에 첨부된 도면을 참조하여 진행한 비한정적인 실시예에 대한 상세한 설명으로부터 더욱 명확해질 것이다.
도 1은 본 출원의 정보 입력 방법에 적용 가능한 예시적 시스템 구조를 나타낸다.
도 2는 본 출원에 따른 정보 입력 방법의 하나의 실시예의 흐름도를 나타낸다.
도 3은 본 출원에 따른 정보 입력 방법의 다른 하나의 실시예의 흐름도를 나타낸다.
Other features, objects, and advantages of the present application will become more apparent from the following detailed description of non-limiting embodiments, which proceeds with reference to the accompanying drawings, in which: FIG.
1 shows an exemplary system structure applicable to the information input method of the present application.
2 shows a flowchart of one embodiment of an information input method according to the present application.
3 shows a flow chart of another embodiment of the information input method according to the present application.

이하, 첨부된 도면 및 실시예들을 결부하여 본 출원에 대한 보다 상세한 설명을 진행하기로 한다. 여기에 설명되는 구체적인 실시예들은 단지 관련된 발명을 해석하기 위한 것일 뿐, 해당 발명을 한정하기 위한 것이 아님을 이해할 수 있을 것이다. 또한, 설명의 편의를 위해 첨부된 도면에는 단지 관련 발명에 관한 부분만이 도시됨을 설명하고자 한다. BRIEF DESCRIPTION OF THE DRAWINGS The present invention will now be described more fully hereinafter with reference to the accompanying drawings and embodiments. It is to be understood that the specific embodiments described herein are for interpretation of the relevant invention only and are not intended to limit the invention in any way. In addition, for convenience of explanation, it is explained that only the parts related to the related invention are shown in the attached drawings.

본 출원의 실시예 및 실시예 중의 특징들은 모순되지 않는 한 서로 조합될 수 있음을 설명하고자 한다. 이하, 첨부된 도면을 참조하고 실시예들을 결부하여 본 출원에 대한 상세한 설명을 진행하기로 한다. It should be noted that the features of the embodiments and embodiments of the present application can be combined with one another without inconsistency. DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Reference will now be made in detail to the present application, examples of which are illustrated in the accompanying drawings.

도 1은 본 출원의 정보 입력 방법에 적용 가능한 예시적 시스템(100) 구조를 나타낸다.1 shows an exemplary system 100 architecture applicable to the information input method of the present application.

도 1에 도시된 바와 같이, 시스템(100)은 단말기(101, 102, 103), 네트워크(104) 및 서버(105)를 포함할 수 있다. 네트워크(104)는 단말기(101, 102, 103)와 서버(105) 사이에서 전송 링크의 매체를 제공한다. 네트워크(104)는 여러 가지 접속 유형을 포함할 수 있으며, 예를 들면 유선 전송 링크, 무선 전송 링크 또는 광케이블 등을 포함할 수 있다.As shown in FIG. 1, the system 100 may include terminals 101, 102, 103, a network 104, and a server 105. The network 104 provides the medium of the transmission link between the terminals 101, 102, 103 and the server 105. The network 104 may include various types of connections and may include, for example, a wired transmission link, a wireless transmission link, or an optical cable.

사용자는 단말기(101, 102, 103)를 사용하여 네트워크(104)를 통해 서버(105)와 인터랙션하여 메시지 등을 송수신할 수 있다. 단말기(101, 102, 103)에는 예를 들면 입력기 유형의 애플리케이션, 브라우저 유형의 애플리케이션, 검색 유형의 애플리케이션, 인스턴트 메신저 유형의 애플리케이션 등 여러 가지 통신 애플리케이션을 인스톨할 수 있다.The user can interact with the server 105 through the network 104 using the terminals 101, 102, and 103 to send and receive messages and the like. The terminals 101, 102, and 103 may be installed with various communication applications, such as an input device type application, a browser type application, a search type application, an instant messenger type application, and the like.

단말기(101, 102, 103)는 디스플레이를 구비하고 네트워크 통신을 서포트하는 여러 가지 전자 기기일 수 있으며, 스마트폰, 태블릿 PC, 전자책 리더, MP3 (Moving Picture Experts Group Audio Layer III,엠페그 오디오 계층 3) 플레이어, MP4(Moving Picture Experts Group Audio Layer IV,엠페그 오디오 계층 4) 플레이어, 랩탑형 컴퓨터, 및 데스크탑형 컴퓨터 등을 포함하나 이에 한정되지 않는다.The terminals 101, 102, and 103 may be various electronic devices having a display and supporting network communication, and may be a smart phone, a tablet PC, an electronic book reader, MP3 (Moving Picture Experts Group Audio Layer III, 3) player, MP4 (Moving Picture Experts Group Audio Layer 4) player, laptop type computer, and desktop type computer.

서버(105)는 단말기(101, 102, 103) 상의 입력기 유형의 애플리케이션을 서포트하는 서버일 수 있다. 서버(105)는 단말기(101, 102, 103)에 의하여 발송된 사용자가 입력한 음성을 식별하여 식별 문구를 얻고, 식별 문구를 분해하며, 분해하여 얻은 복수의 단어 중 확신도가 임계값보다 낮은 단어의 병음(音)을 확정하고, 식별 문구와 확신도가 임계값보다 낮은 단어의 병음을 단말기(101, 102, 103)에 송신할 수 있다. 병음은 알파벳 기호로 중국어 모음과 자음의 발음을 표기하도록 제정한 발음 기호 체계이다. 단말기(101, 102, 103)에서 운행되는 입력기는 예를 들면 시스템 렉시콘(lexicon, 어휘 사전), 사용자 렉시콘, 창작어 렉시콘와 같은 여러 가지 렉시콘을 포함한다. 렉시콘은 사전에 마련된 어휘 데이터베이스에 해당할 수 있다.Server 105 may be a server that supports applications of type type on terminals 101, 102, The server 105 identifies the voice inputted by the user sent by the terminals 101, 102, 103 to obtain an identification phrase, decomposes the identification phrase, and determines whether the degree of confidence among the plurality of words obtained by decomposition is lower than the threshold value It is possible to confirm the pinyin of the word and to transmit the pinyin of the word whose identification phrase and degree of assurance are lower than the threshold value to the terminals 101, 102, Pinyin is an alphabetical symbol and is a phonetic symbol system that is designed to pronounce Chinese vowels and consonants. The input devices operated by the terminals 101, 102 and 103 include various types of lexicons such as, for example, a system lexicon (lexicon), a user lexicon, and a creation arbiter. Lexicon can correspond to a dictionary database prepared in advance.

도 2는 본 출원에 따른 정보 입력 방법의 하나의 실시예(200)의 흐름도를 나타낸다. 도 2를 참조하면, 본 출원에 의한 정보 입력 방법의 하나의 실시예의 흐름을 나타낸다. 본 출원의 실시예에 따른 정보 입력 방법은 예를 들면 도 1의 단말기(101, 102, 103)와 같은 단말기에 의해 실행될 수 있다. 당해 방법은 하기의 단계를 포함한다.Figure 2 shows a flow diagram of one embodiment 200 of an information input method according to the present application. Referring to FIG. 2, there is shown a flow of one embodiment of the information input method according to the present application. The information input method according to the embodiment of the present application can be executed, for example, by a terminal such as the terminals 101, 102, and 103 of FIG. The method comprises the following steps.

단계(201)에 있어서, 사용자가 입력한 음성 정보를 수신한다.In step 201, voice information input by the user is received.

본 실시예에 있어서, 음성 정보는 사용자가 입력기에 입력한 음성일 수 있다. 사용자가 입력기를 이용하여 음성을 입력시, 입력기를 이용 가능한 클라이언트는 사용자가 입력한 음성 정보를 수신한다.In the present embodiment, the voice information may be a voice input by the user to the input device. When a user inputs a voice using an input device, a client that can use the input device receives voice information inputted by the user.

단계(202)에 있어서, 음성 정보를 서버에 송신하고, 서버로부터 송신된 식별 문구와 병음을 수신한다.In step 202, voice information is transmitted to the server, and the identification phrase transmitted from the server and the pinyin are received.

본 실시예에 있어서, 단계(201)을 통하여 사용자가 입력한 음성 정보를 수신한 후, 음성 정보를 서버에 송신할 수 있다. 서버는 사용자가 입력한 음성 정보를 수신하고 이에 대하여 음성 식별을 실행하여 식별 문구를 얻을 수 있다. 그 후, 서버는 식별 문구를 분해하여 복수의 단어를 얻을 수 있다. 서버는 식별 문구를 분해하여 복수의 단어를 얻은 후, 식별 문구를 분해하여 얻은 복수의 단어 중 확신도가 임계값보다 낮은 단어를 확정할 수 있다.In this embodiment, after receiving the voice information input by the user through step 201, voice information can be transmitted to the server. The server receives the voice information input by the user and executes voice identification to obtain the identification phrase. Then, the server can disassemble the identification phrase to obtain a plurality of words. The server can resolve the identification phrase to obtain a plurality of words, and then, among the plurality of words obtained by decomposing the identification phrase, the server can determine a word whose degree of certainty is lower than the threshold value.

본 실시예에 있어서, 식별 문구를 분해하여 얻은 하나의 단어의 확신도는 단어 중 글자의 음절에 의하여 구성 가능한 단어의 수량, 단어와 당해 단어에 인접되어 있는 단어의 매칭 정도에 의하여 확정될 수 있고, 여기서 당해 단어는 식별 문구를 분해하여 얻는다.In the present embodiment, the degree of assurance of one word obtained by decomposing the identification phrase can be determined by the number of words configurable by the syllable of the letters in the word, the degree of matching between the word and words adjacent to the word , Where the word is obtained by decomposing the identification phrase.

예를 들면, 식별 문구를 분해하여 얻은 하나의 단어 중 글자의 음절에 의하여 구성 가능한 단어의 새로운 단어의 수량이 많을 수록, 즉 음절이 부동한 성조를 채용할 경우 조합하여 얻을 수 있는 새로운 단어의 수량이 많을 수록, 당해 단어의 확신도는 낮다. 식별 문구를 분해하여 얻은 하나의 단어와 식별 문구를 분해하여 얻은 복수의 단어 중 당해 단어와 인접한 단어의 매칭 정도가 낮을 수록, 즉 단어 조합을 조성할 가능성이 낮을 수록, 당해 단어의 확신도는 낮다.For example, as the number of new words in a word that can be constituted by the syllable of letters in a single word obtained by decomposing the identification phrase is larger, that is, when a syllable having a different syllable is employed, the number of new words The more confidence in the word is low. The lower the degree of matching between the word and the adjacent word among the plurality of words obtained by decomposing the single word and the identification phrase obtained by decomposing the identification phrase, that is, the lower the likelihood of composing the word combination, .

서버는 식별 문구를 분해하고, 식별 문구를 분해하여 얻은 복수의 단어 중 확신도가 임계값보다 낮은 단어를 확정한 후, 식별 문구를 분해하여 얻은 복수의 단어 중 확신도가 임계값보다 낮은 단어의 병음을 확정할 수 있다.The server decomposes the identification phrase, determines a word among the plurality of words obtained by decomposing the identification phrase, the degree of certainty lower than the threshold value, and extracts the word having the degree of assurance lower than the threshold value among the plurality of words obtained by decomposing the identification phrase Pinyin can be confirmed.

본 실시예에 있어서, 서버가 사용자가 입력한 음성 정보를 수신하고 이에 대하여 음성 식별을 실행하여, 식별 문구를 얻고 식별 문구를 분해하여 얻은 복수의 단어 중 확신도가 임계값보다 낮은 단어의 병음을 확정한 후, 서버로부터 피드백된 식별 문구와 식별 문구를 분해하여 얻은 복수의 단어 중 확신도가 임계값보다 낮은 단어의 병음을 수신할 수 있다.In this embodiment, the server receives the voice information input by the user and performs voice identification on the voice information, obtains the identification phrase, decomposes the identification phrase, and extracts a pair of words having the degree of assurance lower than the threshold After confirming, a plurality of words obtained by decomposing the identification phrase and the identification phrase, which are fed back from the server, can receive the pinyin of the word whose degree of assurance is lower than the threshold value.

단계(203)에 있어서, 사전에 마련된의 렉시콘에서 병음에 대응하는 단어를 검색하고, 조인팅 문구를 얻는다.In step 203, a word corresponding to the pinyin is searched for in a previously prepared Lexicon, and a phrase of joining is obtained.

본 실시예에 있어서, 단계(202)를 통하여 서버로부터 피드백된 식별 문구 및 식별 문구를 분해하여 얻은 복수의 단어 중 확신도가 임계값보다 낮은 단어의 병음을 수신한 후, 사전에 마련된의 렉시콘에서, 예를 들면 사용자 렉시콘에서 당해 확신도가 임계값보다 낮은 단어의 병음에 대응하는 단어를 검색하고, 식별 문구 중 확신도가 임계값보다 낮은 단어를 사전에 마련된의 렉시콘에서 검색된 확신도가 임계값보다 낮은 단어의 병음에 대응하는 단어로 대체하여, 확신도가 임계값보다 낮은 단어의 병음에 대응하는 단어와 식별 문구 중 대체되지 않은 기타 단어를 포함하는 조인팅(jointing) 문구를 얻을 수 있다.In this embodiment, after receiving a pair of words of a word whose degree of assurance is lower than the threshold value among a plurality of words obtained by decomposing the identification phrase and the identification phrase fed back from the server through the step 202, For example, a word corresponding to the Pinyin of the word whose confidence level is lower than the threshold value in the user's Lexicon, and when the degree of certainty of the confidence word searched in the Lexicon of the word having the confidence level lower than the threshold value, It is possible to obtain a jointing phrase including a word corresponding to a pinyin of a word whose degree of certainty is lower than a threshold value and another word which is not replaced among the identification word.

본 실시예의 일부 선택 가능한 실현 형태에 있어서, 사전에 마련된의 렉시콘은 창작어 렉시콘을 포함한다. 서버로부터 피드백된 식별 문구 및 식별 문구를 분해하여 얻은 복수의 단어 중 확신도가 임계값보다 낮은 단어의 병음을 수신한 후, 창작어 렉시콘에서 확신도가 임계값보다 낮은 단어의 병음에 대응하는 단어를 검색할 수 있다. 예를 들면, 사용자가 입력한 음성 정보에 창작어가 포함될 경우, 서버는 사용자가 입력한 음성 정보에 대하여 음성 식별을 실행하여 얻은 식별 문구를 분해한 복수의 단어 중에서, 당해 창작어에 대응하는 단어의 확신도가 임계값보다 낮다고 확정할 수 있으며, 따라서 사용자가 입력한 음성 정보에 대하여 음성 식별을 실행하여 얻은 식별 문구를 분해한 당해 창작어에 대응하는 단어를 확신도가 임계값보다 낮은 단어로 할 수 있다. 그 후, 서버로부터 피드백된 음성 정보에 대하여 음성 식별을 실행하여 얻은 복수의 단어 중 확신도가 임계값보다 낮은 단어의 병음을 수신할 수 있으며, 따라서 창작어 렉시콘에서 확신도가 임계값보다 낮은 단어의 병음에 대응하는 단어를 검색해낼 수 있다. 즉 창작어 렉시콘에서 사용자가 입력한 음성 정보 중의 창작어를 검색해낼 수 있다. 사용자가 입력한 음성 정보 중의 창작어를 검색한 후, 서버가 음성 정보에 대하여 음성 식별을 실행하여 얻은 식별 문구 중 확신도가 임계값보다 낮은 단어 즉 창작어에 대응하는 단어를 병음에 대응하는 검색된 단어 즉 창작어로 대체하여, 창작어와 식별 문구 중 대체되지 않은 기타 단어를 포함하는 조인팅 문구를 얻을 수 있다.In some selectable implementations of this embodiment, the previously prepared Lexicon includes a creative aligner. A word corresponding to a pinyin of a word whose confidence level is lower than a threshold value after receiving a pinyin of a word whose degree of assurance is lower than a threshold value among a plurality of words obtained by decomposing an identification phrase and an identification phrase fed back from the server, Can be searched. For example, when the original speech information includes the original speech, the server extracts, from a plurality of words obtained by decomposing the identification phrase obtained by performing speech recognition on the speech information input by the user, It is possible to determine that the degree of certainty is lower than the threshold value, and therefore, the word corresponding to the word that is obtained by decomposing the identification phrase obtained by performing the voice identification on the voice information input by the user is set to a word whose degree of certainty is lower than the threshold value . Thereafter, among the plurality of words obtained by performing speech recognition on the speech information fed back from the server, the word "Pinyin" of a word whose degree of assurance is lower than the threshold value can be received. Thus, in the creation arbitrator, Can be searched for a word corresponding to the Pinyin of. In other words, it is possible to search the creation word among the voice information inputted by the user in the creation arbiter. After the search word of the voice information input by the user is searched, the server extracts a word having a degree of assurance lower than the threshold value, that is, a word corresponding to the pseudonym, By replacing words, ie, creative words, you can get a joining phrase that includes the original word and other words that are not replaced in the identification phrase.

단계(204)에 있어서, 조인팅 문구에 대응하는 가중(weight)과 식별 문구에 대응하는 가중의 비교 결과에 따라, 사용자에게 표시하는 후보 결과를 확정한다.In step 204, the candidate result to be displayed to the user is determined according to the comparison result of the weight corresponding to the joining phrase and the weight corresponding to the identification phrase.

본 실시예에 있어서, 단계(203)을 통하여 식별 문구 중의 확신도가 임계값보다 낮은 단어를 검색된 병음에 대응하는 단어로 대체하여 조인팅 문구를 얻은 후, 조인팅 문구에 대응하는 가중과 식별 문구에 대응하는 가중의 비교 결과에 따라, 사용자에게 표시하는 후보 결과를 확정할 수 있다.In this embodiment, a word having a degree of assurance lower than a threshold value in the identification phrase is replaced with a word corresponding to the searched Pinyin to obtain a joining phrase, and then a weight corresponding to the joining phrase and an identification phrase The candidate result to be displayed to the user can be determined according to the weighted comparison result corresponding to the weighted value.

본 실시예에 있어서, 하나의 문구에 대응하는 가중은 하기의 방식으로 계산할 수 있다. 문구 중의 매 하나의 단어는 단어도 구조 중의 하나의 노드에 대응하고, 인접한 노드 사이의 관련도를 계산하며, 즉 인접한 단어 사이의 관련도를 계산하며, 관련도의 합을 문구에 대응하는 가중으로 할 수 있다.In this embodiment, the weight corresponding to one phrase can be calculated in the following manner. Each word in the phrase corresponds to one node in the structure and calculates the degree of association between adjacent nodes, i.e., calculates the degree of association between adjacent words, and calculates the sum of degree of relevance as a weight corresponding to the phrase can do.

본 실시예의 일부 선택 가능한 실현 방식에 있어서, 조인팅 문구에 대응하는 가중이 식별 문구에 대응하는 가중보다 클 경우, 조인팅 문구를 사용자에게 표시하는 후보 결과로 할 수 있다. 즉 조인팅 문구를 사용자에게 표시하는 후보 결과로 할 수 있고, 즉 사용자가 단말기에서 운행되는 입력기에 입력한 음성의 후보 결과로 할 수 있다. 조인팅 문구에 대응하는 가중이 식별 문구에 대응하는 가중보다 작을 경우, 식별 문구를 사용자에게 표시하는 후보 결과로 할 수 있다. 즉 식별 문구를 사용자에게 표시하는 후보 결과로 할 수 있고, 즉 사용자가 단말기에서 운행되는 입력기에 입력한 음성의 후보 결과로 할 수 있다.In some selectable implementations of this embodiment, if the weight corresponding to the joining phrase is greater than the weight corresponding to the identification phrase, then the joining phrase may be a candidate result to be displayed to the user. That is, the joining phrase can be a candidate result to be displayed to the user, that is, a candidate result of the voice input by the user to the input device operated by the terminal. When the weight corresponding to the joining phrase is smaller than the weight corresponding to the identification phrase, the identification phrase can be a candidate result to be displayed to the user. That is, the identification phrase can be a candidate result to be displayed to the user, that is, a candidate result of the voice input by the user to the input device operated by the terminal.

예를 들면, 사용자가 입력한 음성 정보에 창작어가 포함될 경우, 서버는 사용자가 입력한 음성 정보에 대하여 음성 식별을 실행하여 얻은 식별 문구를 분해한 당해 창작어에 대응하는 단어의 확신도가 임계값보다 낮다고 확정할 수 있으며, 따라서 사용자가 입력한 음성 정보에 대하여 음성 식별을 실행하여 얻은 식별 문구를 분해한 당해 창작어에 대응하는 단어를 확신도가 임계값보다 낮은 단어로 할 수 있다. 그 후, 서버로부터 피드백된 음성 정보에 대하여 음성 식별을 실행하여 얻은 단어 중 확신도가 임계값보다 낮은 단어의 병음을 수신할 수 있으며, 따라서 창작어 렉시콘에서 확신도가 임계값보다 낮은 단어의 병음에 대응하는 단어 즉 사용자가 입력한 음성 정보 중의 창작어를 검색해낼 수 있다. 사용자가 입력한 음성 정보 중의 창작어를 검색한 후, 서버가 음성 정보에 대하여 음성 식별을 실행하여 얻은 식별 문구 중 확신도가 임계값보다 낮은 단어 즉 창작어에 대응하는 단어를 검색된 병음에 대응하는 단어 즉 창작어로 대체하여, 창작어와 식별 문구 중 대체되지 않은 기타 단어를 포함하는 조인팅 문구를 얻을 수 있다.For example, when the voice information inputted by the user includes the original word, the server extracts the identification phrase obtained by performing the voice recognition on the voice information input by the user, and the degree of assurance of the word corresponding to the original word is set to a threshold value Therefore, it is possible to make the word corresponding to the original word, which is obtained by decomposing the identification phrase obtained by executing the voice identification on the voice information inputted by the user, to a word whose confidence level is lower than the threshold value. Then, it is possible to receive the pinyin of the word having the degree of assurance lower than the threshold value among the words obtained by performing the voice recognition for the voice information fed back from the server, so that the degree of confidence in the creation acycicon is lower than the threshold value The user can search for a word corresponding to the keyword, that is, the keyword in the voice information input by the user. After the search word of the speech information input by the user is searched, a word corresponding to the word whose creativity is lower than the threshold value, that is, a word corresponding to the created word, corresponding to the searched Pinyin By replacing words, ie, creative words, you can get a joining phrase that includes the original word and other words that are not replaced in the identification phrase.

사용자가 입력한 음성 정보 중의 정확하게 식별된 창작어로 식별 문구 중의 확신도가 임계값보다 낮은 단어를 대체했기 때문에, 창작어를 포함하는 조인팅 문구에 대응하는 가중이 서버가 음성 정보에 대하여 음성 식별을 실행하여 얻은 식별 문구에 대응하는 가중보다 크며, 따라서, 창작어를 포함하는 조인팅 문구를 사용자에게 표시하는 후보 결과로 하고, 사용자에게 입력기에 입력한 음성의 정확한 후보 결과를 제공할 수 있다.Since the degree of certainty in the identification phrase in the correctly identified one of the voice information input by the user replaces the word lower in the threshold value than the threshold value, the weight corresponding to the joining phrase including the creation word is used as the voice identification Is greater than the weight corresponding to the identification phrase obtained by the execution so that the joining phrase including the creation word is made as a candidate result to be displayed to the user and the user can be provided with the correct candidate result of the voice inputted to the input device.

도 3은 본 출원에 따른 정보 입력 방법의 다른 하나의 실시예(300)의 흐름도를 나타낸다. 도 3을 참조하면, 본 출원에 의한 정보 입력 방법의 다른 하나의 실시예의 흐름을 나타낸다. 본 출원의 실시예에 따른 정보 입력 방법은 예를 들면 도 1의 서버(105)와 같은 서버에 의해 실행될 수 있다. 당해 방법은 하기의 단계를 포함한다.3 shows a flowchart of another embodiment 300 of an information input method according to the present application. Referring to FIG. 3, there is shown a flow of another embodiment of the information input method according to the present application. The information input method according to the embodiment of the present application can be executed by a server such as the server 105 in Fig. 1, for example. The method comprises the following steps.

단계(301)에 있어서, 단말기로부터 송신된 음성 정보를 수신한다.In step 301, voice information transmitted from the terminal is received.

본 실시예에 있어서, 사용자가 단말기에서 음성 정보를 입력한 후, 단말기로부터 송신된 음성 정보를 수신할 수 있다.In this embodiment, after the user inputs the voice information at the terminal, the user can receive the voice information transmitted from the terminal.

본 실시예의 일부 선택 가능한 실현 방식에 있어서, 음성 정보는 사용자가 단말기에서 운행되는 입력기에 입력한 음성일 수 있다. 사용자가 입력기를 이용하여 음성을 입력할 경우, 단말기로부터 송신된 음성 정보를 수신할 수 있다.In some selectable realization schemes of this embodiment, the voice information may be voice input by a user to an input device that is operated in the terminal. When a user inputs a voice using an input device, the voice information transmitted from the terminal can be received.

단계(302)에 있어서, 음성 정보에 대하여 음성 식별을 실행하여 식별 문구를 얻고, 식별 문구를 분해하여 복수의 단어를 얻는다.In step 302, voice identification is performed on voice information to obtain an identification phrase, and the identification phrase is disassembled to obtain a plurality of words.

본 실시예에 있어서, 단계(301)을 통하여 단말기로부터 송신된 음성 정보를 수신하고, 음성 정보에 대하여 음성 식별을 실행하여 식별 문구를 얻고, 식별 문구를 분해하여 복수의 단어를 얻을 수 있다.In this embodiment, a plurality of words can be obtained by receiving the voice information transmitted from the terminal through the step 301, performing the voice identification on the voice information to obtain the identification phrase, and disassembling the identification phrase.

단계(303)에 있어서, 복수의 단어 중 확신도가 임계값보다 낮은 단어를 확정하고, 식별 문구와 확정된 단어의 병음을 단말기에 송신한다.In step 303, a word having a degree of assurance lower than a threshold value is determined among a plurality of words, and an identification phrase and a pinyin of the confirmed word are transmitted to the terminal.

본 실시예에 있어서, 단계(302)를 통하여 식별 문구를 분해하여 복수의 단어를 얻은 후, 식별 문구를 분해하여 얻은 복수의 단어 중 확신도가 임계값보다 낮은 단어를 확정하고, 식별 문구와 확정된 확신도가 임계값보다 낮은 단어의 병음을 단말기에 송신할 수 있다.In the present embodiment, a plurality of words are obtained by decomposing the identification phrase through step 302, a word having a degree of assurance lower than the threshold value is determined among a plurality of words obtained by decomposing the identification phrase, The degree of certainty of the word is lower than the threshold value.

본 실시예에 있어서, 식별 문구를 분해하여 얻은 하나의 단어의 확신도는 단어 중 글자의 음절에 의하여 구성 가능한 단어의 수량, 단어와 식별 문구를 분해하여 얻은, 단어와 인접한 단어의 매칭 정도에 의하여 확정할 수 있다.In the present embodiment, the degree of assurance of a single word obtained by decomposing the identification phrase is determined by the degree of matching between the word and the adjacent word, obtained by decomposing the number of words constitutable by the syllable of the letters in the word, Can be confirmed.

예를 들면, 식별 문구를 분해하여 얻은 하나의 단어 중 글자의 음절에 의하여 구성 가능한 단어의 새로운 단어의 수량이 많을 수록, 음절이 부동한 성조를 채용할 경우 조합하여 얻을 수 있는 새로운 단어의 수량이 많을 수록, 당해 단어의 확신도는 낮다. 식별 문구를 분해하여 얻은 하나의 단어와 식별 문구를 분해하여 얻은 복수의 단어 중 당해 단어와 인접한 단어의 매칭 정도가 낮을 수록, 즉 단어 조합을 조성할 가능성이 낮을 수록, 당해 단어의 확신도는 낮다.For example, the larger the number of new words in a word that can be constructed by the syllable of letters in a single word obtained by decomposing the identification phrase, the greater the number of new words that can be obtained by combining when the syllable is different The greater the degree of certainty of the word, the lower. The lower the degree of matching between the word and the adjacent word among the plurality of words obtained by decomposing the single word and the identification phrase obtained by decomposing the identification phrase, that is, the lower the likelihood of composing the word combination, .

본 실시예에 있어서, 식별 문구를 분해하고, 얻은 복수의 단어 중 확신도가 임계값보다 낮은 단어를 확정한 후, 확신도가 임계값보다 낮은 단어의 병음을 확정하고, 식별 문구와 확신도가 임계값보다 낮은 단어의 병음을 단말기에 송신할 수 있다.In this embodiment, after the identification phrase is disassembled and a word having a degree of certainty lower than the threshold value is determined among the plurality of words obtained, a pinyin of a word whose degree of certainty is lower than a threshold value is determined, It is possible to transmit a pinyin of a word lower than the threshold value to the terminal.

단말기는 식별 문구와 확신도가 임계값보다 낮은 단어의 병음을 수신한 후, 사전에 마련된의 렉시콘에서 확신도가 임계값보다 낮은 단어의 병음에 대응하는 단어를 검색하고, 식별 문구 중의 확신도가 임계값보다 낮은 단어를 검색된 병음에 대응하는 단어로 대체하여 조인팅 문구를 얻을 수 있다. 단말기는 조인팅 문구에 대응하는 가중과 식별 문구에 대응하는 가중의 비교 결과에 따라, 사용자에게 표시하는 후보 결과를 확정할 수 있고, 즉 사용자가 단말기에서 운행되는 입력기에 입력한 음성의 후보 결과를 확정할 수 있다.The terminal searches for a word corresponding to the pinyin of the word whose confidence degree is lower than the threshold value in the Lexicon prepared before the identification word and the pinyin of the word whose confidence level is lower than the threshold value, A word lower than the threshold value may be replaced with a word corresponding to the detected Pinyin to obtain a joining phrase. The terminal can determine the candidate result to be displayed to the user based on the comparison result between the weight corresponding to the joining phrase and the weight corresponding to the identification phrase, that is, the candidate result of the voice inputted to the input device operated by the user Can be confirmed.

본 실시예에 있어서, 하나의 문구에 대응하는 가중은 하기의 방식을 채용하여 계산할 수 있다. 문구 중의 매 하나의 단어는 단어도 구조 중의 하나의 노드에 대응하고, 인접한 노드 사이의 관련도를 계산하며, 즉 인접한 단어 사이의 관련도를 계산하며, 관련도의 합을 문구에 대응하는 가중으로 할 수 있다.In this embodiment, the weight corresponding to one phrase can be calculated by employing the following method. Each word in the phrase corresponds to one node in the structure and calculates the degree of association between adjacent nodes, i.e., calculates the degree of association between adjacent words, and calculates the sum of degree of relevance as a weight corresponding to the phrase can do.

본 실시예의 일부 선택 가능한 실현 방식에 있어서, 단말기가 식별 문구를 분해하여 얻은 복수의 단어 중 확신도가 임계값보다 낮은 단어의 병음을 수신한 후, 단말기는 단말기의 사전에 마련된의 렉시콘에서 확신도가 임계값보다 낮은 단어의 병음에 대응하는 단어를 검색할 수 있다. 그 후, 단말기로부터 송신되되 단말기의 사전에 마련된의 렉시콘에서 검색된 확신도가 임계값보다 낮은 단어의 병음에 대응하는 단어를 수신할 수 있으며, 식별 문구 중의 확신도가 임계값보다 낮은 단어를 사전에 마련된의 렉시콘에서 검색된 확신도가 임계값보다 낮은 단어의 병음에 대응하는 단어로 대체하여 조인팅 문구를 얻는다. 사전에 마련된의 렉시콘은 창작어 렉시콘일 수 있다. 조인팅 문구에 대응하는 가중이 식별 문구에 대응하는 가중보다 클 경우, 조인팅 문구를 단말기에 송신하는 문구로 할 수 있으며, 따라서, 단말기는 조인팅 문구를 사용자에게 표시하는 후보 결과로 할 수 있고, 즉 사용자가 단말기에서 운행되는 입력기에 입력한 음성의 후보 결과로 할 수 있다. 조인팅 문구에 대응하는 가중이 식별 문구에 대응하는 가중보다 작을 경우, 식별 문구를 단말기에 송신하는 문구로 할 수 있으며, 따라서, 단말기는 식별 문구를 사용자에게 표시하는 후보 결과로 할수 있고, 즉 사용자가 단말기에서 운행되는 입력기에 입력한 음성의 후보 결과로 할 수 있다.In some selectable realization schemes of the present embodiment, after the terminal receives the pinyin of the word whose degree of assurance is lower than the threshold value among the plurality of words obtained by decomposing the identification phrase, The word corresponding to the Pinyin of the word lower than the threshold can be searched. Thereafter, a word corresponding to a pinyin of a word which is transmitted from the terminal and whose degree of assurance searched in the Lexicon provided in advance of the terminal is lower than a threshold value can be received, and a word having a degree of assurance lower than the threshold value A word corresponding to the pinyin of the word lower than the threshold value is substituted for the confidence degree searched in the prepared Lexicon to obtain a joining phrase. A pre-built Lexicon can be a creative Lexicon. If the weight corresponding to the joining phrase is larger than the weight corresponding to the identification phrase, the joining phrase may be a phrase for transmitting to the terminal, so that the terminal can make the joining phrase as a candidate result to display to the user I.e., a candidate result of the voice inputted by the user to the input device operated in the terminal. When the weight corresponding to the joining phrase is smaller than the weight corresponding to the identification phrase, the identification phrase can be a phrase for transmitting to the terminal, so that the terminal can make the identification phrase a candidate result to be displayed to the user, May be a candidate result of the voice inputted to the input device operated in the terminal.

본 출원은 단말기를 더 제공하며, 당해 단말기에는 하나 또는 복수의 프로세서; 및 하나 또는 복수의 프로그램을 저장하기 위한 메모리가 설치될 수 있으며, 하나 또는 복수의 프로그램에는 상기 단계(201)~단계(204)에서 서술된 동작을 실행하기 위한 명령어가 포함될 수 있다. 하나 또는 복수의 프로그램이 하나 또는 복수의 프로세서에 의해 실행될 경우, 하나 또는 복수의 프로세서가 상기 단계(201)~단계(204)에서 서술된 동작을 수행하도록 한다.The present application further provides a terminal, wherein the terminal comprises one or more processors; And a memory for storing one or a plurality of programs may be installed, and one or a plurality of programs may include instructions for executing the operations described in steps (201) to (204). When one or more programs are executed by one or more processors, one or more processors may perform the operations described in steps (201) to (204).

본 출원은 서버를 더 제공하며, 당해 서버에는 하나 또는 복수의 프로세서; 및 하나 또는 복수의 프로그램을 저장하기 위한 메모리가 설치될 수 있으며, 하나 또는 복수의 프로그램에는 상기 단계(301)~단계(303)에서 서술된 동작을 실행하기 위한 명령어가 포함될 수 있다. 하나 또는 복수의 프로그램이 하나 또는 복수의 프로세서에 의해 실행될 경우, 하나 또는 복수의 프로세서가 상기 단계(301)~단계(303)에서 서술된 동작을 실행하도록 한다.The present application further provides a server, wherein the server includes one or more processors; And a memory for storing one or a plurality of programs may be installed, and one or a plurality of programs may include instructions for executing the operations described in steps (301) to (303). When one or more programs are executed by one or a plurality of processors, one or a plurality of processors execute the operations described in steps (301) to (303).

본 출원은 컴퓨터 판독 가능한 비휘발성 매체를 더 제공하며, 당해 컴퓨터 판독 가능한 매체는 단말기에 포함될 수도 있고, 별도로 존재하여 단말기에 설치되지 않을 수도 있다. 당해 컴퓨터 판독 가능한 비휘발성 매체에는 하나 또는 복수의 프로그램이 로딩되어 있으며, 하나 또는 복수의 프로그램이 단말기에 의해 실행될 경우, 단말기로 하여금 사용자가 입력한 음성 정보를 수신하고, 음성 정보를 서버에 송신하며, 서버로부터 송신된 식별 문구와 병음을 수신하고, 즉 음성 정보에 대하여 음성 식별을 실행하여 얻은 식별 문구와 음성 정보에 대하여 음성 식별을 실행하여 얻은 식별 문구를 분해한 단어 중 확신도가 임계값보다 낮은 단어의 병음을 수신하고, 사전에 마련된의 렉시콘에서 병음에 대응하는 단어를 검색하며, 식별 문구 중의 확신도가 임계값보다 낮은 단어를 검색된 병음에 대응하는 단어로 대체하여 조인팅 문구를 얻으며, 조인팅 문구에 대응하는 가중과 식별 문구에 대응하는 가중의 비교 결과에 따라, 사용자에게 표시하는 후보 결과를 확정하도록 한다.The present application further provides a computer readable nonvolatile medium which may be included in the terminal or may be separately present and not installed in the terminal. The computer readable nonvolatile medium is loaded with one or a plurality of programs, and when one or a plurality of programs are executed by the terminal, the terminal receives the voice information inputted by the user, transmits the voice information to the server , An identification phrase transmitted from the server and a pinyin, that is, an identification phrase obtained by performing voice identification for voice information, and an identification phrase obtained by performing voice identification for voice information, A word corresponding to a pinyin is retrieved from a Lexicon prepared in advance and a word having a degree of assurance lower than a threshold value is replaced with a word corresponding to the retrieved pinyin to obtain a joining phrase, Depending on the weighting corresponding to the joining phrase and the weighting corresponding to the identifying phrase, The results appear to confirm the candidate for.

본 출원은 컴퓨터 판독 가능한 비휘발성 매체를 더 제공하며, 당해 컴퓨터 판독 가능한 비휘발성 매체는 서버에 포함될 수도 있고, 별도로 존재하여 서버에 설치되지 않을 수도 있다. 당해 컴퓨터 판독 가능한 비휘발성 매체에는 하나 또는 복수의 프로그램이 로딩되어 있으며, 하나 또는 복수의 프로그램이 서버에 의해 실행될 경우, 서버로 하여금 단말기로부터 송신된 음성 정보를 수신하고, 음성 정보에 대하여 음성 식별을 실행하여 식별 문구를 얻으며, 식별 문구를 분해하여 복수의 단어를 얻고, 복수의 단어 중 확신도가 임계값보다 낮은 단어를 확정하며, 식별 문구와 확정된 단어의 병음을 단말기에 송신하도록 한다.The present application further provides a computer-readable non-volatile medium, which may be included in the server, or may be separately provided and not installed in the server. The computer readable nonvolatile medium is loaded with one or a plurality of programs, and when one or a plurality of programs are executed by the server, the server receives the voice information transmitted from the terminal, Acquiring an identification phrase, disassembling the identification phrase to obtain a plurality of words, determining a word having a degree of assurance lower than a threshold value among the plurality of words, and transmitting the identification word and the pinyin of the determined word to the terminal.

상기 컴퓨터 판독 가능한 비휘발성 매체는 컴퓨터 판독 가능한 신호 매체 또는 컴퓨터 판독 가능한 비휘발성 저장 매체 또는 상기 양자의 임의의 조합일 수 있음을 설명하고자 한다. 컴퓨터 판독 가능한 저장 매체는 예를 들면 전기, 자기, 광, 전자기, 적외선 또는 반도체의 시스템, 장치 또는 소자, 또는 상기 매체의 임의의 조합을 포함할 수 있으나 이에 한정되지 않는다. 컴퓨터 판독 가능한 비휘발성 저장 매체의 더 구체적인 예는 하나 또는 복수의 도선을 구비하는 전기적 연결, 휴대용 컴퓨터 디스크, 하드 디스크, RAM, ROM, EPROM 또는 플래시 메모리, 광케이블, 휴대용 콤팩트 자기 디스크 롬(CD-ROM), 광 기억 소자, 자기 기억 소자 또는 상기 메모리의 임의의 합당한 조합을 포함할 수 있으나 이에 한정되지 않는다. 본 출원에 있어서, 컴퓨터 판독 가능한 비휘발성 저장 매체는 프로그램을 포함하거나 저장하는 임의의 유형 매체일 수 있으며, 당해 프로그램은 명령어 실행 시스템, 장치 또는 소자에 의해 사용되거나, 또는 그와 결합하어 사용된다. 한편, 본 출원에 있어서, 컴퓨터 판독 가능한 신호 매체는 베이스밴드 또는 반송파의 일부분으로서 전파되는 데이터 신호에 포함될 수 있으며, 그 중에는 컴퓨터 판독 가능한 프로그램 코드가 로딩되어 있다. 이러한 전파되는 데이터 신호는 여러 가지 형식을 채용할 수 있으며, 전자기 신호, 광신호 또는 상기 신호의 임의의 합당한 조합을 포함하나 이에 한정되지 않는다. 컴퓨터 판독 가능한 신호 매체는 컴퓨터 판독 가능한 비휘발성 저장 매체 이외의 컴퓨터 판독 가능한 임의의 비휘발성 매체일 수 있으며, 당해 컴퓨터 판독 가능한 매체는 명령어 실행 시스템, 장치 또는 소자에 의해 사용되거나 또는 그와 결합하어 사용되는 프로그램을 송신, 전파 또는 전송할 수 있다. 컴퓨터 판독 가능한 매체에 포함되는 프로그램 코드는 임의의 합당한 매체로 전송 가능하며, 무선, 전기선, 광 파이버, RF 등등 또는 상기 매체의 임의의 합당한 조합을 포함하나 이에 한정되지 않는다.The computer-readable non-volatile media may be a computer-readable signal medium or a computer-readable non-volatile storage medium or any combination of the two. The computer-readable storage medium may include, but is not limited to, a system, device or element of, for example, electrical, magnetic, optical, electromagnetic, infrared or semiconductor, or any combination of such media. More specific examples of computer readable non-volatile storage media include, but are not limited to, electrical connections with one or more leads, portable computer disks, hard disks, RAM, ROM, EPROM or flash memory, optical cables, ), Optical storage elements, magnetic storage elements, or any suitable combination of such memories. In the present application, a computer-readable non-volatile storage medium may be any type of medium that includes or stores a program, which is used by, or in combination with, an instruction execution system, apparatus, or element. Meanwhile, in the present application, a computer-readable signal medium may be included in a data signal that is propagated as part of a baseband or carrier wave, among which computer-readable program code is loaded. Such propagated data signals may employ various formats and include, but are not limited to, electromagnetic signals, optical signals, or any suitable combination of such signals. The computer-readable signal carrier may be any computer-readable non-volatile medium other than a computer-readable non-volatile storage medium, which may be used by or in connection with an instruction execution system, apparatus, To transmit, to transmit, or to transmit the program. The program code contained in the computer readable medium may be transmitted on any suitable medium and includes, but is not limited to, wireless, electrical lines, optical fibers, RF, etc., or any suitable combination of such media.

이상의 설명은 단지 본 출원의 비교적 바람직한 실시예 및 운용한 기술적 원리에 대한 설명이다. 본 출원에 관련된 발명의 범위가 상기 기술적 특징들의 특정 조합으로 이루어진 기술적 방안들에 한정되는 것이 아니라 본 발명의 주지를 벗어나지 않고서 상기 기술적 특징들 또는 그들의 균등한 특징들의 임의의 조합으로 이루어진 기타 기술적 방안들도 포함되어야 함을 해당 기술분야의 당업자는 이해하여야 한다. 예를 들어, 상기 특징들과 본 출원에 개시되어 있으나 이에 한정되지 않는 유사한 기능을 구비한 기술적 특징을 서로 대체하여 이루어진 기술적 방안도 포함된다. The foregoing description is merely an illustration of the relatively preferred embodiments of the present application and the technical principles in operation. It is to be understood that the scope of the invention as claimed in the present application is not limited to technical solutions made up of specific combinations of the technical features but may be applied to other technical solutions made up of any combination of the technical features or their equivalent features without departing from the gist of the invention It should be understood by those skilled in the art. For example, technical measures made by replacing the above-described features with technical features having similar functions as those disclosed in this application, but not limited thereto, are also included.

Claims (10)

사용자가 입력한 음성 정보를 수신하는 단계;
상기 음성 정보를 서버에 송신하고, 상기 서버로부터 송신된 식별 문구와 병음을 수신하는 단계;
사전에 마련된의 렉시콘에서 상기 병음에 대응하는 단어를 검색하고, 상기 식별 문구 중 확신도가 임계값보다 낮은 단어를 검색된 상기 병음에 대응하는 단어로 대체하여 조인팅 문구를 얻는 단계; 및
상기 조인팅 문구에 대응하는 가중과 상기 식별 문구에 대응하는 가중의 비교 결과에 따라, 사용자에게 표시하는 후보 결과를 확정하는 단계를 포함하되,
여기서 상기 식별 문구는 상기 음성 정보에 대하여 음성 식별을 실행하여 얻고, 상기 병음은 상기 음성 정보에 대하여 음성 식별을 실행하여 얻은 식별 문구를 분해한 단어 중 확신도가 임계값보다 낮은 단어의 병음인 것을 특징으로 하는 정보 입력 방법.
Receiving voice information input by a user;
Transmitting the voice information to a server, receiving an identification phrase transmitted from the server and a pinyin;
Retrieving a word corresponding to the pinyin from a previously prepared Lexicon and replacing a word having a degree of assurance lower than a threshold value in the identification phrase with a word corresponding to the retrieved pinyin to obtain a joining phrase; And
Determining a candidate result to be displayed to a user according to a result of comparison between a weight corresponding to the joining phrase and a weight corresponding to the identification phrase,
Wherein the identification phrase is obtained by performing voice identification on the voice information, and the Pinyin is a Pinyin of a word whose degree of assurance is lower than a threshold value among words obtained by disassembling the identification phrase obtained by performing voice identification on the voice information Characterized in that the information input method comprises:
제1항에 있어서,
상기 후보 결과를 확정하는 단계는,
상기 조인팅 문구에 대응하는 가중이 상기 식별 문구에 대응하는 가중보다 클 경우, 상기 조인팅 문구를 사용자에게 표시하는 상기 후보 결과로 하는 단계; 및
상기 조인팅 문구에 대응하는 가중이 상기 식별 문구에 대응하는 가중보다 작을 경우, 상기 식별 문구를 사용자에게 표시하는 상기 후보 결과로 하는 단계를 포함하는 것을 특징으로 하는 정보 입력 방법.
The method according to claim 1,
Determining the candidate result comprises:
If the weight corresponding to the joining phrase is greater than the weight corresponding to the identification phrase, making the joining phrase as a candidate result to the user; And
And if the weight corresponding to the joining phrase is smaller than the weight corresponding to the identification phrase, determining the candidate result to display the identification phrase to a user.
제2항에 있어서,
상기 사전에 마련된의 렉시콘은 창작어 렉시콘을 포함하는 것을 특징으로 하는 정보 입력 방법.
3. The method of claim 2,
Wherein the pre-prepared Lexicon comprises a creative aligner.
단말기로부터 송신된 음성 정보를 수신하는 단계;
상기 음성 정보에 대하여 음성 식별을 실행하여 식별 문구를 얻고, 상기 식별 문구를 분해하여 복수의 단어를 얻는 단계; 및
상기 복수의 단어 중 확신도가 임계값보다 낮은 단어를 확정하고, 상기 식별 문구와 상기 확정된 단어의 병음을 단말기에 송신하는 단계를 포함하는 것을 특징으로 하는 정보 입력 방법.
Receiving voice information transmitted from a terminal;
Performing voice identification on the voice information to obtain an identification phrase, and decomposing the identification phrase to obtain a plurality of words; And
Determining a word having a degree of assurance lower than a threshold value among the plurality of words, and transmitting the identification phrase and the pinyin of the confirmed word to the terminal.
제4항에 있어서,
상기 방법은,
상기 단말기로부터 송신된 사전에 마련된의 렉시콘에서 검색된 상기 병음에 대응하는 단어를 수신하고, 상기 식별 문구 중의 확신도가 임계값보다 낮은 단어를 상기 병음에 대응하는 단어로 대체하여 조인팅 문구를 얻는 단계;
상기 조인팅 문구에 대응하는 가중이 상기 식별 문구에 대응하는 가중보다 클 경우, 상기 조인팅 문구를 단말기에 송신하는 단계; 및
상기 조인팅 문구에 대응하는 가중이 상기 식별 문구에 대응하는 가중보다 작을 경우, 상기 식별 문구를 단말기에 송신하는 단계를 더 포함하되,
여기서, 상기 사전에 마련된의 렉시콘은 창작어 렉시콘을 포함하는 것을 특징으로 하는 정보 입력 방법.
5. The method of claim 4,
The method comprises:
Receiving a word corresponding to the pinyin found in a previously prepared lexicon transmitted from the terminal and replacing a word having a degree of assurance lower than a threshold value in the identification phrase with a word corresponding to the pinyin to obtain a joining phrase ;
If the weight corresponding to the joining phrase is greater than the weight corresponding to the identification phrase, transmitting the joining phrase to the terminal; And
If the weight corresponding to the joining phrase is less than the weight corresponding to the identification phrase, transmitting the identification phrase to the terminal,
The information input method according to claim 1, wherein the pre-prepared Lexicon includes a creation aligner.
제5항에 있어서,
상기 음성 정보는 사용자가 단말기에서 운행되는 입력기에 입력한 음성인 것을 특징으로 하는 정보 입력 방법.
6. The method of claim 5,
Wherein the voice information is a voice input by the user to an input unit operated by the terminal.
하나 또는 복수의 프로세서; 및
하나 또는 복수의 프로그램을 저장하기 위한 메모리를 포함하며,
상기 하나 또는 복수의 프로그램이 상기 하나 또는 복수의 프로세서에 의해 실행될 경우, 상기 하나 또는 복수의 프로세서가 제1항 내지 제3항 중 어느 한 항의 방법을 실현하도록 하는 것을 특징으로 하는 단말기.
One or more processors; And
A memory for storing one or a plurality of programs,
Wherein said one or more processors are adapted to implement the method of any one of claims 1 to 3 when said one or more programs are executed by said one or more processors.
하나 또는 복수의 프로세서; 및
하나 또는 복수의 프로그램을 저장하기 위한 메모리를 포함하며,
상기 하나 또는 복수의 프로그램이 상기 하나 또는 복수의 프로세서에 의해 실행될 경우, 상기 하나 또는 복수의 프로세서가 제4항 내지 제6항 중 어느 한 항의 방법을 실현하도록 하는 것을 특징으로 하는 서버.
One or more processors; And
A memory for storing one or a plurality of programs,
Wherein when said one or more programs are executed by said one or more processors, said one or more processors are adapted to implement the method of any one of claims 4 to 6.
컴퓨터 프로그램이 저장되어 있는 컴퓨터 판독 가능한 저장 매체에 있어서,
당해 프로그램이 프로세서에 의해 실행될 경우, 제1항 내지 제3항 중 어느 한 항의 방법을 실현하는 것을 특징으로 하는 컴퓨터 판독 가능한 저장 매체.
A computer readable storage medium storing a computer program,
A computer readable storage medium characterized by realizing the method of any one of claims 1 to 3 when the program is executed by a processor.
컴퓨터 프로그램이 저장되어 있는 컴퓨터 판독 가능한 저장 매체에 있어서,
당해 프로그램이 프로세서에 의해 실행될 경우, 제4항 내지 제6항 중 어느 한 항의 방법을 실현하는 것을 특징으로 하는 컴퓨터 판독 가능한 저장 매체.
A computer readable storage medium storing a computer program,
A computer-readable storage medium characterized by realizing the method of any one of claims 4 to 6 when the program is executed by a processor.
KR1020180014324A 2017-06-23 2018-02-06 Information inputting method KR102046486B1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201710486956.0A CN107301866B (en) 2017-06-23 2017-06-23 Information input method
CN201710486956.0 2017-06-23

Publications (2)

Publication Number Publication Date
KR20190000776A true KR20190000776A (en) 2019-01-03
KR102046486B1 KR102046486B1 (en) 2019-11-19

Family

ID=60135972

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180014324A KR102046486B1 (en) 2017-06-23 2018-02-06 Information inputting method

Country Status (3)

Country Link
JP (1) JP6612907B2 (en)
KR (1) KR102046486B1 (en)
CN (1) CN107301866B (en)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108509416B (en) * 2018-03-20 2022-10-11 京东方科技集团股份有限公司 Sentence meaning identification method and device, equipment and storage medium
CN109062891B (en) * 2018-07-09 2022-07-26 重庆邂智科技有限公司 Media processing method, device, terminal and medium
CN110619879A (en) * 2019-08-29 2019-12-27 深圳市梦网科技发展有限公司 Voice recognition method and device
CN110767234B (en) * 2019-10-31 2022-12-23 抖音视界有限公司 Audio information processing method and device, electronic equipment and storage medium
CN111160014B (en) * 2019-12-03 2023-05-16 北京博瑞彤芸科技股份有限公司 Intelligent word segmentation method
CN111192586B (en) * 2020-01-08 2023-07-04 北京小米松果电子有限公司 Speech recognition method and device, electronic equipment and storage medium
CN114091408A (en) * 2020-08-04 2022-02-25 科沃斯商用机器人有限公司 Text correction method, model training method, correction model, equipment and robot
CN112259182B (en) * 2020-11-05 2023-08-11 中国联合网络通信集团有限公司 Method and device for generating electronic medical record
CN113506584B (en) * 2021-07-06 2024-05-14 腾讯音乐娱乐科技(深圳)有限公司 Data processing method and device

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090129192A (en) 2008-06-12 2009-12-16 엘지전자 주식회사 Mobile terminal and voice recognition method
JP2012063526A (en) * 2010-09-15 2012-03-29 Ntt Docomo Inc Terminal device, speech recognition method and speech recognition program

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102867512A (en) * 2011-07-04 2013-01-09 余喆 Method and device for recognizing natural speech
JP6251958B2 (en) * 2013-01-28 2017-12-27 富士通株式会社 Utterance analysis device, voice dialogue control device, method, and program
CN105302795B (en) * 2015-11-11 2018-03-20 河海大学 Chinese text check system and method based on the fuzzy pronunciation of Chinese and speech recognition
CN106598939B (en) * 2016-10-21 2019-09-17 北京三快在线科技有限公司 A kind of text error correction method and device, server, storage medium

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090129192A (en) 2008-06-12 2009-12-16 엘지전자 주식회사 Mobile terminal and voice recognition method
JP2012063526A (en) * 2010-09-15 2012-03-29 Ntt Docomo Inc Terminal device, speech recognition method and speech recognition program

Also Published As

Publication number Publication date
CN107301866B (en) 2021-01-05
KR102046486B1 (en) 2019-11-19
JP6612907B2 (en) 2019-11-27
JP2019008771A (en) 2019-01-17
CN107301866A (en) 2017-10-27

Similar Documents

Publication Publication Date Title
KR102046486B1 (en) Information inputting method
CN107256267B (en) Query method and device
JP6923332B2 (en) Automatic interpretation method and equipment
US10297252B2 (en) Predicting and learning carrier phrases for speech input
US10339916B2 (en) Generation and application of universal hypothesis ranking model
CN108369580B (en) Language and domain independent model based approach to on-screen item selection
US11645470B2 (en) Automated testing of dialog systems
US11217236B2 (en) Method and apparatus for extracting information
US9064006B2 (en) Translating natural language utterances to keyword search queries
CN111462740B (en) Voice command matching for non-phonetic alphabet language voice assisted application prototype testing
US10242670B2 (en) Syntactic re-ranking of potential transcriptions during automatic speech recognition
US10572594B2 (en) Extracting domain-specific actions and entities in natural language commands recognized based on edition and recognition scores
US11074280B2 (en) Cluster based search and recommendation method to rapidly on-board commands in personal assistants
JP2010524138A (en) Multiple mode input method editor
US11080330B2 (en) Generation of digital content navigation data
CN109858045B (en) Machine translation method and device
CN109791761A (en) Use the acoustic training model of the term of correction
CN107112009B (en) Method, system and computer-readable storage device for generating a confusion network
CN110268472B (en) Detection mechanism for automated dialog system
WO2020156342A1 (en) Voice recognition method and device, electronic device and storage medium
US11056103B2 (en) Real-time utterance verification system and method thereof
Feng et al. Question classification by approximating semantics
WO2020052060A1 (en) Method and apparatus for generating correction statement
CN110765271A (en) Entity discovery and entity link joint processing method and device
CN116049370A (en) Information query method and training method and device of information generation model

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant