KR102046486B1 - 정보 입력 방법 - Google Patents

정보 입력 방법 Download PDF

Info

Publication number
KR102046486B1
KR102046486B1 KR1020180014324A KR20180014324A KR102046486B1 KR 102046486 B1 KR102046486 B1 KR 102046486B1 KR 1020180014324 A KR1020180014324 A KR 1020180014324A KR 20180014324 A KR20180014324 A KR 20180014324A KR 102046486 B1 KR102046486 B1 KR 102046486B1
Authority
KR
South Korea
Prior art keywords
phrase
word
identification
pinyin
terminal
Prior art date
Application number
KR1020180014324A
Other languages
English (en)
Other versions
KR20190000776A (ko
Inventor
민후 판
Original Assignee
베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. filed Critical 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디.
Publication of KR20190000776A publication Critical patent/KR20190000776A/ko
Application granted granted Critical
Publication of KR102046486B1 publication Critical patent/KR102046486B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Telephonic Communication Services (AREA)

Abstract

본 출원은 정보 입력 방법을 개시한다. 당해 방법의 하나의 구체적인 실시형태는 사용자가 입력한 음성 정보를 수신하는 단계; 음성 정보를 서버에 송신하고, 서버로부터 송신된 식별 문구와 병음을 수신하는 단계; 사전에 마련된의 렉시콘에서 병음에 대응하는 단어를 검색하고, 식별 문구 중의 확신도가 임계값보다 낮은 단어를 검색된 병음에 대응하는 단어로 대체하여 조인팅 문구를 얻는 단계; 및 조인팅 문구에 대응하는 가중과 식별 문구에 대응하는 가중의 비교 결과에 따라, 사용자에게 표시하는 후보 결과를 확정하는 단계를 포함하되, 여기서 상기 식별문구는 음성 정보에 대하여 음성 식별을 실행하여 얻고, 상기 병음은 음성 정보에 대하여 음성 식별을 실행하여 얻은 식별 문구를 분해한 단어 중 확신도가 임계값보다 낮은 단어의 병음이다. 사용자가 입력기에 입력한 음성 중의 예를 들면 사용자의 창작어와 같은 단어를 정확하게 식별하며, 입력기의 음성 입력에 있어서 사용자에게 정확한 후보 결과를 제공하는 것을 실현한다.

Description

정보 입력 방법{INFORMATION INPUTTING METHOD}
본 출원은 컴퓨터 분야에 관한 것으로서, 구체적으로는 입력기 분야에 관한 것이며, 특히 정보 입력 방법에 관한 것이다.
현재, 일부 입력기에 있어서, 사용자에게 음성 입력 기능을 제공한다. 사용자가 음성 정보를 입력한 후, 사용자에게 표시하는 후보 결과는 서버가 음성 정보에 대하여 음성 식별을 실행한 후의 통용 결과이다.
하지만, 부동한 사용자가 사용하는 단어의 개성화 특징을 고려하지 않았기 때문에, 사용자가 입력한 음성 중에서 사용자의 창작어와 같은 단어를 정확하게 식별할 수 없으며, 입력기의 음성 입력에 있어서 사용자에게 정확한 후보 결과를 제공할 수 없게 된다.
한국공개특허 제10-2009-0129192호
본 출원은 상기 배경 기술 부분에 존재하는 기술 문제를 해결하기 위한 정보 입력 방법을 제공한다.
본 출원은 정보 입력 방법을 제공하며, 당해 방법은 사용자가 입력한 음성 정보를 수신하는 단계; 상기 음성 정보를 서버에 송신하고, 서버로부터 송신된 식별 문구와 병음을 수신하는 단계; 사전에 마련된의 렉시콘에서 상기 병음에 대응하는 단어를 검색하고, 식별 문구 중의 상기 확신도가 임계값보다 낮은 단어를 검색된 상기 병음에 대응하는 단어로 대체하여 조인팅 문구를 얻는 단계; 및 상기 조인팅 문구에 대응하는 가중과 식별 문구에 대응하는 가중의 비교 결과에 따라, 사용자에게 표시하는 후보 결과를 확정하는 단계를 포함하되, 여기서 상기 식별 문구는 상기 음성 정보에 대하여 음성 식별을 실행하여 얻고, 상기 병음은 상기 음성 정보에 대하여 음성 식별을 실행하여 얻은 식별 문구를 분해한 단어 중 확신도가 임계값보다 낮은 단어의 병음이다.
본 출원은 정보 입력 방법을 제공하며, 당해 방법은 단말기로부터 송신된 음성 정보를 수신하는 단계; 상기 음성 정보에 대하여 음성 식별을 실행하여 식별 문구를 얻고, 상기 식별 문구를 분해하여 복수의 단어를 얻는 단계; 및 상기 복수의 단어 중 확신도가 임계값보다 낮은 단어를 확정하고, 식별 문구와 확정된 단어의 병음을 단말기에 송신하는 단계를 포함한다.
본 출원에 따른 정보 입력 방법에 있어서, 사용자가 입력한 음성 정보를 수신하며, 음성 정보를 서버에 송신하고, 서버로부터 송신된 식별 문구와 병음을 수신하며, 즉 음성 정보에 대하여 음성 식별을 실행하여 얻은 식별 문구와 음성 정보에 대하여 음성 식별을 실행하여 얻은 식별 문구를 분해한 단어 중 확신도가 임계값보다 낮은 단어의 병음을 수신하며, 사전에 마련된의 렉시콘에서 병음에 대응하는 단어를 검색하고, 식별 문구 중의 확신도가 임계값보다 낮은 단어를 검색된 병음에 대응하는 단어로 대체하여 조인팅 문구를 얻으며, 조인팅 문구에 대응하는 가중과 식별 문구에 대응하는 가중의 비교 결과에 따라, 사용자에게 표시하는 후보 결과를 확정하는 것을 통하여, 사용자가 입력기에 입력한 음성 중의 예를 들면 사용자의 창작어와 같은 단어를 정확하게 식별하며, 입력기의 음성 입력에 있어서 사용자에게 정확한 후보 결과를 제공하는 것을 실현한다.
본 출원의 기타 특징, 목적 및 이점은 아래에 첨부된 도면을 참조하여 진행한 비한정적인 실시예에 대한 상세한 설명으로부터 더욱 명확해질 것이다.
도 1은 본 출원의 정보 입력 방법에 적용 가능한 예시적 시스템 구조를 나타낸다.
도 2는 본 출원에 따른 정보 입력 방법의 하나의 실시예의 흐름도를 나타낸다.
도 3은 본 출원에 따른 정보 입력 방법의 다른 하나의 실시예의 흐름도를 나타낸다.
이하, 첨부된 도면 및 실시예들을 결부하여 본 출원에 대한 보다 상세한 설명을 진행하기로 한다. 여기에 설명되는 구체적인 실시예들은 단지 관련된 발명을 해석하기 위한 것일 뿐, 해당 발명을 한정하기 위한 것이 아님을 이해할 수 있을 것이다. 또한, 설명의 편의를 위해 첨부된 도면에는 단지 관련 발명에 관한 부분만이 도시됨을 설명하고자 한다.
본 출원의 실시예 및 실시예 중의 특징들은 모순되지 않는 한 서로 조합될 수 있음을 설명하고자 한다. 이하, 첨부된 도면을 참조하고 실시예들을 결부하여 본 출원에 대한 상세한 설명을 진행하기로 한다.
도 1은 본 출원의 정보 입력 방법에 적용 가능한 예시적 시스템(100) 구조를 나타낸다.
도 1에 도시된 바와 같이, 시스템(100)은 단말기(101, 102, 103), 네트워크(104) 및 서버(105)를 포함할 수 있다. 네트워크(104)는 단말기(101, 102, 103)와 서버(105) 사이에서 전송 링크의 매체를 제공한다. 네트워크(104)는 여러 가지 접속 유형을 포함할 수 있으며, 예를 들면 유선 전송 링크, 무선 전송 링크 또는 광케이블 등을 포함할 수 있다.
사용자는 단말기(101, 102, 103)를 사용하여 네트워크(104)를 통해 서버(105)와 인터랙션하여 메시지 등을 송수신할 수 있다. 단말기(101, 102, 103)에는 예를 들면 입력기 유형의 애플리케이션, 브라우저 유형의 애플리케이션, 검색 유형의 애플리케이션, 인스턴트 메신저 유형의 애플리케이션 등 여러 가지 통신 애플리케이션을 인스톨할 수 있다.
단말기(101, 102, 103)는 디스플레이를 구비하고 네트워크 통신을 서포트하는 여러 가지 전자 기기일 수 있으며, 스마트폰, 태블릿 PC, 전자책 리더, MP3 (Moving Picture Experts Group Audio Layer III,엠페그 오디오 계층 3) 플레이어, MP4(Moving Picture Experts Group Audio Layer IV,엠페그 오디오 계층 4) 플레이어, 랩탑형 컴퓨터, 및 데스크탑형 컴퓨터 등을 포함하나 이에 한정되지 않는다.
서버(105)는 단말기(101, 102, 103) 상의 입력기 유형의 애플리케이션을 서포트하는 서버일 수 있다. 서버(105)는 단말기(101, 102, 103)에 의하여 발송된 사용자가 입력한 음성을 식별하여 식별 문구를 얻고, 식별 문구를 분해하며, 분해하여 얻은 복수의 단어 중 확신도가 임계값보다 낮은 단어의 병음(音)을 확정하고, 식별 문구와 확신도가 임계값보다 낮은 단어의 병음을 단말기(101, 102, 103)에 송신할 수 있다. 병음은 알파벳 기호로 중국어 모음과 자음의 발음을 표기하도록 제정한 발음 기호 체계이다. 단말기(101, 102, 103)에서 운행되는 입력기는 예를 들면 시스템 렉시콘(lexicon, 어휘 사전), 사용자 렉시콘, 창작어 렉시콘와 같은 여러 가지 렉시콘을 포함한다. 렉시콘은 사전에 마련된 어휘 데이터베이스에 해당할 수 있다.
도 2는 본 출원에 따른 정보 입력 방법의 하나의 실시예(200)의 흐름도를 나타낸다. 도 2를 참조하면, 본 출원에 의한 정보 입력 방법의 하나의 실시예의 흐름을 나타낸다. 본 출원의 실시예에 따른 정보 입력 방법은 예를 들면 도 1의 단말기(101, 102, 103)와 같은 단말기에 의해 실행될 수 있다. 당해 방법은 하기의 단계를 포함한다.
단계(201)에 있어서, 사용자가 입력한 음성 정보를 수신한다.
본 실시예에 있어서, 음성 정보는 사용자가 입력기에 입력한 음성일 수 있다. 사용자가 입력기를 이용하여 음성을 입력시, 입력기를 이용 가능한 클라이언트는 사용자가 입력한 음성 정보를 수신한다.
단계(202)에 있어서, 음성 정보를 서버에 송신하고, 서버로부터 송신된 식별 문구와 병음을 수신한다.
본 실시예에 있어서, 단계(201)을 통하여 사용자가 입력한 음성 정보를 수신한 후, 음성 정보를 서버에 송신할 수 있다. 서버는 사용자가 입력한 음성 정보를 수신하고 이에 대하여 음성 식별을 실행하여 식별 문구를 얻을 수 있다. 그 후, 서버는 식별 문구를 분해하여 복수의 단어를 얻을 수 있다. 서버는 식별 문구를 분해하여 복수의 단어를 얻은 후, 식별 문구를 분해하여 얻은 복수의 단어 중 확신도가 임계값보다 낮은 단어를 확정할 수 있다.
본 실시예에 있어서, 식별 문구를 분해하여 얻은 하나의 단어의 확신도는 단어 중 글자의 음절에 의하여 구성 가능한 단어의 수량, 단어와 당해 단어에 인접되어 있는 단어의 매칭 정도에 의하여 확정될 수 있고, 여기서 당해 단어는 식별 문구를 분해하여 얻는다.
예를 들면, 식별 문구를 분해하여 얻은 하나의 단어 중 글자의 음절에 의하여 구성 가능한 단어의 새로운 단어의 수량이 많을 수록, 즉 음절이 부동한 성조를 채용할 경우 조합하여 얻을 수 있는 새로운 단어의 수량이 많을 수록, 당해 단어의 확신도는 낮다. 식별 문구를 분해하여 얻은 하나의 단어와 식별 문구를 분해하여 얻은 복수의 단어 중 당해 단어와 인접한 단어의 매칭 정도가 낮을 수록, 즉 단어 조합을 조성할 가능성이 낮을 수록, 당해 단어의 확신도는 낮다.
서버는 식별 문구를 분해하고, 식별 문구를 분해하여 얻은 복수의 단어 중 확신도가 임계값보다 낮은 단어를 확정한 후, 식별 문구를 분해하여 얻은 복수의 단어 중 확신도가 임계값보다 낮은 단어의 병음을 확정할 수 있다.
본 실시예에 있어서, 서버가 사용자가 입력한 음성 정보를 수신하고 이에 대하여 음성 식별을 실행하여, 식별 문구를 얻고 식별 문구를 분해하여 얻은 복수의 단어 중 확신도가 임계값보다 낮은 단어의 병음을 확정한 후, 서버로부터 피드백된 식별 문구와 식별 문구를 분해하여 얻은 복수의 단어 중 확신도가 임계값보다 낮은 단어의 병음을 수신할 수 있다.
단계(203)에 있어서, 사전에 마련된의 렉시콘에서 병음에 대응하는 단어를 검색하고, 조인팅 문구를 얻는다.
본 실시예에 있어서, 단계(202)를 통하여 서버로부터 피드백된 식별 문구 및 식별 문구를 분해하여 얻은 복수의 단어 중 확신도가 임계값보다 낮은 단어의 병음을 수신한 후, 사전에 마련된의 렉시콘에서, 예를 들면 사용자 렉시콘에서 당해 확신도가 임계값보다 낮은 단어의 병음에 대응하는 단어를 검색하고, 식별 문구 중 확신도가 임계값보다 낮은 단어를 사전에 마련된의 렉시콘에서 검색된 확신도가 임계값보다 낮은 단어의 병음에 대응하는 단어로 대체하여, 확신도가 임계값보다 낮은 단어의 병음에 대응하는 단어와 식별 문구 중 대체되지 않은 기타 단어를 포함하는 조인팅(jointing) 문구를 얻을 수 있다.
본 실시예의 일부 선택 가능한 실현 형태에 있어서, 사전에 마련된의 렉시콘은 창작어 렉시콘을 포함한다. 서버로부터 피드백된 식별 문구 및 식별 문구를 분해하여 얻은 복수의 단어 중 확신도가 임계값보다 낮은 단어의 병음을 수신한 후, 창작어 렉시콘에서 확신도가 임계값보다 낮은 단어의 병음에 대응하는 단어를 검색할 수 있다. 예를 들면, 사용자가 입력한 음성 정보에 창작어가 포함될 경우, 서버는 사용자가 입력한 음성 정보에 대하여 음성 식별을 실행하여 얻은 식별 문구를 분해한 복수의 단어 중에서, 당해 창작어에 대응하는 단어의 확신도가 임계값보다 낮다고 확정할 수 있으며, 따라서 사용자가 입력한 음성 정보에 대하여 음성 식별을 실행하여 얻은 식별 문구를 분해한 당해 창작어에 대응하는 단어를 확신도가 임계값보다 낮은 단어로 할 수 있다. 그 후, 서버로부터 피드백된 음성 정보에 대하여 음성 식별을 실행하여 얻은 복수의 단어 중 확신도가 임계값보다 낮은 단어의 병음을 수신할 수 있으며, 따라서 창작어 렉시콘에서 확신도가 임계값보다 낮은 단어의 병음에 대응하는 단어를 검색해낼 수 있다. 즉 창작어 렉시콘에서 사용자가 입력한 음성 정보 중의 창작어를 검색해낼 수 있다. 사용자가 입력한 음성 정보 중의 창작어를 검색한 후, 서버가 음성 정보에 대하여 음성 식별을 실행하여 얻은 식별 문구 중 확신도가 임계값보다 낮은 단어 즉 창작어에 대응하는 단어를 병음에 대응하는 검색된 단어 즉 창작어로 대체하여, 창작어와 식별 문구 중 대체되지 않은 기타 단어를 포함하는 조인팅 문구를 얻을 수 있다.
단계(204)에 있어서, 조인팅 문구에 대응하는 가중(weight)과 식별 문구에 대응하는 가중의 비교 결과에 따라, 사용자에게 표시하는 후보 결과를 확정한다.
본 실시예에 있어서, 단계(203)을 통하여 식별 문구 중의 확신도가 임계값보다 낮은 단어를 검색된 병음에 대응하는 단어로 대체하여 조인팅 문구를 얻은 후, 조인팅 문구에 대응하는 가중과 식별 문구에 대응하는 가중의 비교 결과에 따라, 사용자에게 표시하는 후보 결과를 확정할 수 있다.
본 실시예에 있어서, 하나의 문구에 대응하는 가중은 하기의 방식으로 계산할 수 있다. 문구 중의 매 하나의 단어는 단어도 구조 중의 하나의 노드에 대응하고, 인접한 노드 사이의 관련도를 계산하며, 즉 인접한 단어 사이의 관련도를 계산하며, 관련도의 합을 문구에 대응하는 가중으로 할 수 있다.
본 실시예의 일부 선택 가능한 실현 방식에 있어서, 조인팅 문구에 대응하는 가중이 식별 문구에 대응하는 가중보다 클 경우, 조인팅 문구를 사용자에게 표시하는 후보 결과로 할 수 있다. 즉 조인팅 문구를 사용자에게 표시하는 후보 결과로 할 수 있고, 즉 사용자가 단말기에서 운행되는 입력기에 입력한 음성의 후보 결과로 할 수 있다. 조인팅 문구에 대응하는 가중이 식별 문구에 대응하는 가중보다 작을 경우, 식별 문구를 사용자에게 표시하는 후보 결과로 할 수 있다. 즉 식별 문구를 사용자에게 표시하는 후보 결과로 할 수 있고, 즉 사용자가 단말기에서 운행되는 입력기에 입력한 음성의 후보 결과로 할 수 있다.
예를 들면, 사용자가 입력한 음성 정보에 창작어가 포함될 경우, 서버는 사용자가 입력한 음성 정보에 대하여 음성 식별을 실행하여 얻은 식별 문구를 분해한 당해 창작어에 대응하는 단어의 확신도가 임계값보다 낮다고 확정할 수 있으며, 따라서 사용자가 입력한 음성 정보에 대하여 음성 식별을 실행하여 얻은 식별 문구를 분해한 당해 창작어에 대응하는 단어를 확신도가 임계값보다 낮은 단어로 할 수 있다. 그 후, 서버로부터 피드백된 음성 정보에 대하여 음성 식별을 실행하여 얻은 단어 중 확신도가 임계값보다 낮은 단어의 병음을 수신할 수 있으며, 따라서 창작어 렉시콘에서 확신도가 임계값보다 낮은 단어의 병음에 대응하는 단어 즉 사용자가 입력한 음성 정보 중의 창작어를 검색해낼 수 있다. 사용자가 입력한 음성 정보 중의 창작어를 검색한 후, 서버가 음성 정보에 대하여 음성 식별을 실행하여 얻은 식별 문구 중 확신도가 임계값보다 낮은 단어 즉 창작어에 대응하는 단어를 검색된 병음에 대응하는 단어 즉 창작어로 대체하여, 창작어와 식별 문구 중 대체되지 않은 기타 단어를 포함하는 조인팅 문구를 얻을 수 있다.
사용자가 입력한 음성 정보 중의 정확하게 식별된 창작어로 식별 문구 중의 확신도가 임계값보다 낮은 단어를 대체했기 때문에, 창작어를 포함하는 조인팅 문구에 대응하는 가중이 서버가 음성 정보에 대하여 음성 식별을 실행하여 얻은 식별 문구에 대응하는 가중보다 크며, 따라서, 창작어를 포함하는 조인팅 문구를 사용자에게 표시하는 후보 결과로 하고, 사용자에게 입력기에 입력한 음성의 정확한 후보 결과를 제공할 수 있다.
도 3은 본 출원에 따른 정보 입력 방법의 다른 하나의 실시예(300)의 흐름도를 나타낸다. 도 3을 참조하면, 본 출원에 의한 정보 입력 방법의 다른 하나의 실시예의 흐름을 나타낸다. 본 출원의 실시예에 따른 정보 입력 방법은 예를 들면 도 1의 서버(105)와 같은 서버에 의해 실행될 수 있다. 당해 방법은 하기의 단계를 포함한다.
단계(301)에 있어서, 단말기로부터 송신된 음성 정보를 수신한다.
본 실시예에 있어서, 사용자가 단말기에서 음성 정보를 입력한 후, 단말기로부터 송신된 음성 정보를 수신할 수 있다.
본 실시예의 일부 선택 가능한 실현 방식에 있어서, 음성 정보는 사용자가 단말기에서 운행되는 입력기에 입력한 음성일 수 있다. 사용자가 입력기를 이용하여 음성을 입력할 경우, 단말기로부터 송신된 음성 정보를 수신할 수 있다.
단계(302)에 있어서, 음성 정보에 대하여 음성 식별을 실행하여 식별 문구를 얻고, 식별 문구를 분해하여 복수의 단어를 얻는다.
본 실시예에 있어서, 단계(301)을 통하여 단말기로부터 송신된 음성 정보를 수신하고, 음성 정보에 대하여 음성 식별을 실행하여 식별 문구를 얻고, 식별 문구를 분해하여 복수의 단어를 얻을 수 있다.
단계(303)에 있어서, 복수의 단어 중 확신도가 임계값보다 낮은 단어를 확정하고, 식별 문구와 확정된 단어의 병음을 단말기에 송신한다.
본 실시예에 있어서, 단계(302)를 통하여 식별 문구를 분해하여 복수의 단어를 얻은 후, 식별 문구를 분해하여 얻은 복수의 단어 중 확신도가 임계값보다 낮은 단어를 확정하고, 식별 문구와 확정된 확신도가 임계값보다 낮은 단어의 병음을 단말기에 송신할 수 있다.
본 실시예에 있어서, 식별 문구를 분해하여 얻은 하나의 단어의 확신도는 단어 중 글자의 음절에 의하여 구성 가능한 단어의 수량, 단어와 식별 문구를 분해하여 얻은, 단어와 인접한 단어의 매칭 정도에 의하여 확정할 수 있다.
예를 들면, 식별 문구를 분해하여 얻은 하나의 단어 중 글자의 음절에 의하여 구성 가능한 단어의 새로운 단어의 수량이 많을 수록, 음절이 부동한 성조를 채용할 경우 조합하여 얻을 수 있는 새로운 단어의 수량이 많을 수록, 당해 단어의 확신도는 낮다. 식별 문구를 분해하여 얻은 하나의 단어와 식별 문구를 분해하여 얻은 복수의 단어 중 당해 단어와 인접한 단어의 매칭 정도가 낮을 수록, 즉 단어 조합을 조성할 가능성이 낮을 수록, 당해 단어의 확신도는 낮다.
본 실시예에 있어서, 식별 문구를 분해하고, 얻은 복수의 단어 중 확신도가 임계값보다 낮은 단어를 확정한 후, 확신도가 임계값보다 낮은 단어의 병음을 확정하고, 식별 문구와 확신도가 임계값보다 낮은 단어의 병음을 단말기에 송신할 수 있다.
단말기는 식별 문구와 확신도가 임계값보다 낮은 단어의 병음을 수신한 후, 사전에 마련된의 렉시콘에서 확신도가 임계값보다 낮은 단어의 병음에 대응하는 단어를 검색하고, 식별 문구 중의 확신도가 임계값보다 낮은 단어를 검색된 병음에 대응하는 단어로 대체하여 조인팅 문구를 얻을 수 있다. 단말기는 조인팅 문구에 대응하는 가중과 식별 문구에 대응하는 가중의 비교 결과에 따라, 사용자에게 표시하는 후보 결과를 확정할 수 있고, 즉 사용자가 단말기에서 운행되는 입력기에 입력한 음성의 후보 결과를 확정할 수 있다.
본 실시예에 있어서, 하나의 문구에 대응하는 가중은 하기의 방식을 채용하여 계산할 수 있다. 문구 중의 매 하나의 단어는 단어도 구조 중의 하나의 노드에 대응하고, 인접한 노드 사이의 관련도를 계산하며, 즉 인접한 단어 사이의 관련도를 계산하며, 관련도의 합을 문구에 대응하는 가중으로 할 수 있다.
본 실시예의 일부 선택 가능한 실현 방식에 있어서, 단말기가 식별 문구를 분해하여 얻은 복수의 단어 중 확신도가 임계값보다 낮은 단어의 병음을 수신한 후, 단말기는 단말기의 사전에 마련된의 렉시콘에서 확신도가 임계값보다 낮은 단어의 병음에 대응하는 단어를 검색할 수 있다. 그 후, 단말기로부터 송신되되 단말기의 사전에 마련된의 렉시콘에서 검색된 확신도가 임계값보다 낮은 단어의 병음에 대응하는 단어를 수신할 수 있으며, 식별 문구 중의 확신도가 임계값보다 낮은 단어를 사전에 마련된의 렉시콘에서 검색된 확신도가 임계값보다 낮은 단어의 병음에 대응하는 단어로 대체하여 조인팅 문구를 얻는다. 사전에 마련된의 렉시콘은 창작어 렉시콘일 수 있다. 조인팅 문구에 대응하는 가중이 식별 문구에 대응하는 가중보다 클 경우, 조인팅 문구를 단말기에 송신하는 문구로 할 수 있으며, 따라서, 단말기는 조인팅 문구를 사용자에게 표시하는 후보 결과로 할 수 있고, 즉 사용자가 단말기에서 운행되는 입력기에 입력한 음성의 후보 결과로 할 수 있다. 조인팅 문구에 대응하는 가중이 식별 문구에 대응하는 가중보다 작을 경우, 식별 문구를 단말기에 송신하는 문구로 할 수 있으며, 따라서, 단말기는 식별 문구를 사용자에게 표시하는 후보 결과로 할수 있고, 즉 사용자가 단말기에서 운행되는 입력기에 입력한 음성의 후보 결과로 할 수 있다.
본 출원은 단말기를 더 제공하며, 당해 단말기에는 하나 또는 복수의 프로세서; 및 하나 또는 복수의 프로그램을 저장하기 위한 메모리가 설치될 수 있으며, 하나 또는 복수의 프로그램에는 상기 단계(201)~단계(204)에서 서술된 동작을 실행하기 위한 명령어가 포함될 수 있다. 하나 또는 복수의 프로그램이 하나 또는 복수의 프로세서에 의해 실행될 경우, 하나 또는 복수의 프로세서가 상기 단계(201)~단계(204)에서 서술된 동작을 수행하도록 한다.
본 출원은 서버를 더 제공하며, 당해 서버에는 하나 또는 복수의 프로세서; 및 하나 또는 복수의 프로그램을 저장하기 위한 메모리가 설치될 수 있으며, 하나 또는 복수의 프로그램에는 상기 단계(301)~단계(303)에서 서술된 동작을 실행하기 위한 명령어가 포함될 수 있다. 하나 또는 복수의 프로그램이 하나 또는 복수의 프로세서에 의해 실행될 경우, 하나 또는 복수의 프로세서가 상기 단계(301)~단계(303)에서 서술된 동작을 실행하도록 한다.
본 출원은 컴퓨터 판독 가능한 비휘발성 매체를 더 제공하며, 당해 컴퓨터 판독 가능한 매체는 단말기에 포함될 수도 있고, 별도로 존재하여 단말기에 설치되지 않을 수도 있다. 당해 컴퓨터 판독 가능한 비휘발성 매체에는 하나 또는 복수의 프로그램이 로딩되어 있으며, 하나 또는 복수의 프로그램이 단말기에 의해 실행될 경우, 단말기로 하여금 사용자가 입력한 음성 정보를 수신하고, 음성 정보를 서버에 송신하며, 서버로부터 송신된 식별 문구와 병음을 수신하고, 즉 음성 정보에 대하여 음성 식별을 실행하여 얻은 식별 문구와 음성 정보에 대하여 음성 식별을 실행하여 얻은 식별 문구를 분해한 단어 중 확신도가 임계값보다 낮은 단어의 병음을 수신하고, 사전에 마련된의 렉시콘에서 병음에 대응하는 단어를 검색하며, 식별 문구 중의 확신도가 임계값보다 낮은 단어를 검색된 병음에 대응하는 단어로 대체하여 조인팅 문구를 얻으며, 조인팅 문구에 대응하는 가중과 식별 문구에 대응하는 가중의 비교 결과에 따라, 사용자에게 표시하는 후보 결과를 확정하도록 한다.
본 출원은 컴퓨터 판독 가능한 비휘발성 매체를 더 제공하며, 당해 컴퓨터 판독 가능한 비휘발성 매체는 서버에 포함될 수도 있고, 별도로 존재하여 서버에 설치되지 않을 수도 있다. 당해 컴퓨터 판독 가능한 비휘발성 매체에는 하나 또는 복수의 프로그램이 로딩되어 있으며, 하나 또는 복수의 프로그램이 서버에 의해 실행될 경우, 서버로 하여금 단말기로부터 송신된 음성 정보를 수신하고, 음성 정보에 대하여 음성 식별을 실행하여 식별 문구를 얻으며, 식별 문구를 분해하여 복수의 단어를 얻고, 복수의 단어 중 확신도가 임계값보다 낮은 단어를 확정하며, 식별 문구와 확정된 단어의 병음을 단말기에 송신하도록 한다.
상기 컴퓨터 판독 가능한 비휘발성 매체는 컴퓨터 판독 가능한 신호 매체 또는 컴퓨터 판독 가능한 비휘발성 저장 매체 또는 상기 양자의 임의의 조합일 수 있음을 설명하고자 한다. 컴퓨터 판독 가능한 저장 매체는 예를 들면 전기, 자기, 광, 전자기, 적외선 또는 반도체의 시스템, 장치 또는 소자, 또는 상기 매체의 임의의 조합을 포함할 수 있으나 이에 한정되지 않는다. 컴퓨터 판독 가능한 비휘발성 저장 매체의 더 구체적인 예는 하나 또는 복수의 도선을 구비하는 전기적 연결, 휴대용 컴퓨터 디스크, 하드 디스크, RAM, ROM, EPROM 또는 플래시 메모리, 휴대용 콤팩트 자기 디스크 롬(CD-ROM), 광 기억 소자, 자기 기억 소자 또는 상기 메모리의 임의의 합당한 조합을 포함할 수 있으나 이에 한정되지 않는다. 본 출원에 있어서, 컴퓨터 판독 가능한 비휘발성 저장 매체는 프로그램을 포함하거나 저장하는 임의의 유형 매체일 수 있으며, 당해 프로그램은 명령어 실행 시스템, 장치 또는 소자에 의해 사용되거나, 또는 그와 결합하어 사용된다. 한편, 본 출원에 있어서, 컴퓨터 판독 가능한 신호 매체는 베이스밴드 또는 반송파의 일부분으로서 전파되는 데이터 신호에 포함될 수 있으며, 그 중에는 컴퓨터 판독 가능한 프로그램 코드가 로딩되어 있다. 이러한 전파되는 데이터 신호는 여러 가지 형식을 채용할 수 있으며, 전자기 신호, 광신호 또는 상기 신호의 임의의 합당한 조합을 포함하나 이에 한정되지 않는다. 컴퓨터 판독 가능한 신호 매체는 컴퓨터 판독 가능한 비휘발성 저장 매체 이외의 컴퓨터 판독 가능한 임의의 비휘발성 매체일 수 있으며, 당해 컴퓨터 판독 가능한 매체는 명령어 실행 시스템, 장치 또는 소자에 의해 사용되거나 또는 그와 결합하어 사용되는 프로그램을 송신, 전파 또는 전송할 수 있다. 컴퓨터 판독 가능한 매체에 포함되는 프로그램 코드는 임의의 합당한 매체로 전송 가능하며, 무선, 전기선, 광 파이버, RF 등등 또는 상기 매체의 임의의 합당한 조합을 포함하나 이에 한정되지 않는다.
이상의 설명은 단지 본 출원의 비교적 바람직한 실시예 및 운용한 기술적 원리에 대한 설명이다. 본 출원에 관련된 발명의 범위가 상기 기술적 특징들의 특정 조합으로 이루어진 기술적 방안들에 한정되는 것이 아니라 본 발명의 주지를 벗어나지 않고서 상기 기술적 특징들 또는 그들의 균등한 특징들의 임의의 조합으로 이루어진 기타 기술적 방안들도 포함되어야 함을 해당 기술분야의 당업자는 이해하여야 한다. 예를 들어, 상기 특징들과 본 출원에 개시되어 있으나 이에 한정되지 않는 유사한 기능을 구비한 기술적 특징을 서로 대체하여 이루어진 기술적 방안도 포함된다.

Claims (10)

  1. 정보 입력 방법에 있어서,
    단말기가 사용자에 의해 입력된 음성 정보를 수신하는 단계;
    상기 단말기가 상기 음성 정보를 서버에 송신하고, 상기 서버로부터 송신된 식별 문구와 병음을 상기 단말기가 수신하는 단계;
    상기 단말기가 사전에 마련된 렉시콘에서 상기 병음에 대응하는 단어를 검색하고, 상기 식별 문구 중 확신도가 임계값보다 낮은 단어를 검색된 상기 병음에 대응하는 단어로 대체하여 조인팅 문구를 얻는 단계; 및
    상기 단말기가 상기 조인팅 문구에 대응하는 가중과 상기 식별 문구에 대응하는 가중의 비교 결과에 따라, 사용자에게 표시하는 후보 결과를 확정하는 단계를 포함하되,
    여기서 상기 식별 문구는 상기 서버가 상기 음성 정보에 대하여 음성 식별을 실행하여 얻고, 상기 병음은 상기 서버가 상기 음성 정보에 대하여 음성 식별을 실행하여 얻은 식별 문구를 분해한 단어 중 확신도가 임계값보다 낮은 단어의 병음이며,
    하나의 문구에 대한 상기 가중은, 문구 중의 매 하나의 단어가 하나의 노드에 대응하는 단어도 구조에서 인접한 노드 사이의 관련도의 합으로 계산되는 것을 특징으로 하는 정보 입력 방법.
  2. 제1항에 있어서,
    상기 단말기가 상기 후보 결과를 확정하는 단계는,
    상기 조인팅 문구에 대응하는 가중이 상기 식별 문구에 대응하는 가중보다 클 경우, 상기 조인팅 문구를 사용자에게 표시하는 상기 후보 결과로 하는 단계; 및
    상기 조인팅 문구에 대응하는 가중이 상기 식별 문구에 대응하는 가중보다 작을 경우, 상기 식별 문구를 사용자에게 표시하는 상기 후보 결과로 하는 단계를 포함하는 것을 특징으로 하는 정보 입력 방법.
  3. 제2항에 있어서,
    상기 사전에 마련된 렉시콘은 창작어 렉시콘을 포함하는 것을 특징으로 하는 정보 입력 방법.
  4. 정보 입력 방법에 있어서,
    서버가 단말기로부터 송신된 음성 정보를 수신하는 단계;
    상기 서버가 상기 음성 정보에 대하여 음성 식별을 실행하여 식별 문구를 얻고, 상기 식별 문구를 분해하여 복수의 단어를 얻는 단계; 및
    상기 서버가 상기 복수의 단어 중 확신도가 임계값보다 낮은 단어를 확정하고, 상기 식별 문구와 상기 확정된 단어의 병음을 단말기에 송신하는 단계를 포함하고,
    상기 서버는, 상기 단말기로부터 송신된 사전에 마련된 렉시콘에서 검색된 상기 병음에 대응하는 단어를 수신하고, 상기 식별 문구 중의 확신도가 임계값보다 낮은 단어를 검색된 상기 병음에 대응하는 단어로 대체하여 조인팅 문구를 얻고,
    상기 서버는, 상기 조인팅 문구에 대응하는 가중과 상기 식별 문구에 대응하는 가중의 비교 결과에 따라, 사용자에게 표시하는 후보 결과를 확정하되,
    하나의 문구에 대한 상기 가중은, 문구 중의 매 하나의 단어가 하나의 노드에 대응하는 단어도 구조에서 인접한 노드 사이의 관련도의 합으로 계산되는 것을 특징으로 하는 정보 입력 방법.
  5. 제4항에 있어서,
    상기 방법은,
    상기 조인팅 문구에 대응하는 가중이 상기 식별 문구에 대응하는 가중보다 클 경우, 상기 서버가 상기 조인팅 문구를 단말기에 송신하는 단계; 및
    상기 조인팅 문구에 대응하는 가중이 상기 식별 문구에 대응하는 가중보다 작을 경우, 상기 서버가 상기 식별 문구를 단말기에 송신하는 단계를 더 포함하되,
    여기서, 상기 사전에 마련된 렉시콘은 창작어 렉시콘을 포함하는 것을 특징으로 하는 정보 입력 방법.
  6. 제5항에 있어서,
    상기 음성 정보는 사용자가 단말기에서 운행되는 입력기에 입력한 음성인 것을 특징으로 하는 정보 입력 방법.
  7. 하나 또는 복수의 프로세서; 및
    하나 또는 복수의 프로그램을 저장하기 위한 메모리를 포함하며,
    상기 하나 또는 복수의 프로그램이 상기 하나 또는 복수의 프로세서에 의해 실행될 경우, 상기 하나 또는 복수의 프로세서가 제1항 내지 제3항 중 어느 한 항의 방법을 실현하도록 하는 것을 특징으로 하는 단말기.
  8. 하나 또는 복수의 프로세서; 및
    하나 또는 복수의 프로그램을 저장하기 위한 메모리를 포함하며,
    상기 하나 또는 복수의 프로그램이 상기 하나 또는 복수의 프로세서에 의해 실행될 경우, 상기 하나 또는 복수의 프로세서가 제4항 내지 제6항 중 어느 한 항의 방법을 실현하도록 하는 것을 특징으로 하는 서버.
  9. 컴퓨터 프로그램이 저장되어 있는 컴퓨터 판독 가능한 저장 매체에 있어서,
    당해 프로그램이 프로세서에 의해 실행될 경우, 제1항 내지 제3항 중 어느 한 항의 방법을 실현하는 것을 특징으로 하는 컴퓨터 판독 가능한 저장 매체.
  10. 컴퓨터 프로그램이 저장되어 있는 컴퓨터 판독 가능한 저장 매체에 있어서,
    당해 프로그램이 프로세서에 의해 실행될 경우, 제4항 내지 제6항 중 어느 한 항의 방법을 실현하는 것을 특징으로 하는 컴퓨터 판독 가능한 저장 매체.
KR1020180014324A 2017-06-23 2018-02-06 정보 입력 방법 KR102046486B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201710486956.0A CN107301866B (zh) 2017-06-23 2017-06-23 信息输入方法
CN201710486956.0 2017-06-23

Publications (2)

Publication Number Publication Date
KR20190000776A KR20190000776A (ko) 2019-01-03
KR102046486B1 true KR102046486B1 (ko) 2019-11-19

Family

ID=60135972

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180014324A KR102046486B1 (ko) 2017-06-23 2018-02-06 정보 입력 방법

Country Status (3)

Country Link
JP (1) JP6612907B2 (ko)
KR (1) KR102046486B1 (ko)
CN (1) CN107301866B (ko)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108509416B (zh) * 2018-03-20 2022-10-11 京东方科技集团股份有限公司 句意识别方法及装置、设备和存储介质
CN109062891B (zh) * 2018-07-09 2022-07-26 重庆邂智科技有限公司 媒体处理方法、装置、终端和介质
CN110619879A (zh) * 2019-08-29 2019-12-27 深圳市梦网科技发展有限公司 一种语音识别的方法及装置
CN110767234B (zh) * 2019-10-31 2022-12-23 抖音视界有限公司 音频信息处理方法、装置、电子设备及存储介质
CN111160014B (zh) * 2019-12-03 2023-05-16 北京博瑞彤芸科技股份有限公司 一种智能分词方法
CN111192586B (zh) * 2020-01-08 2023-07-04 北京小米松果电子有限公司 语音识别方法及装置、电子设备、存储介质
CN114091408A (zh) * 2020-08-04 2022-02-25 科沃斯商用机器人有限公司 文本纠正、模型训练方法、纠正模型、设备及机器人
CN112259182B (zh) * 2020-11-05 2023-08-11 中国联合网络通信集团有限公司 一种电子病历的生成方法和装置
CN113506584B (zh) * 2021-07-06 2024-05-14 腾讯音乐娱乐科技(深圳)有限公司 数据处理方法以及设备
CN115346531B (zh) * 2022-08-02 2024-08-09 启迪万众网络科技(北京)有限公司 一种语音媒体处理用语音转文字识别系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012063526A (ja) * 2010-09-15 2012-03-29 Ntt Docomo Inc 端末装置、音声認識方法および音声認識プログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101513615B1 (ko) 2008-06-12 2015-04-20 엘지전자 주식회사 이동 단말기 및 그 음성 인식 방법
CN102867512A (zh) * 2011-07-04 2013-01-09 余喆 自然语音识别方法和装置
JP6251958B2 (ja) * 2013-01-28 2017-12-27 富士通株式会社 発話解析装置、音声対話制御装置、方法、及びプログラム
CN105302795B (zh) * 2015-11-11 2018-03-20 河海大学 基于汉语模糊发音和语音识别的中文文本校验系统及方法
CN106598939B (zh) * 2016-10-21 2019-09-17 北京三快在线科技有限公司 一种文本纠错方法及装置、服务器、存储介质

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012063526A (ja) * 2010-09-15 2012-03-29 Ntt Docomo Inc 端末装置、音声認識方法および音声認識プログラム

Also Published As

Publication number Publication date
KR20190000776A (ko) 2019-01-03
JP6612907B2 (ja) 2019-11-27
CN107301866B (zh) 2021-01-05
JP2019008771A (ja) 2019-01-17
CN107301866A (zh) 2017-10-27

Similar Documents

Publication Publication Date Title
KR102046486B1 (ko) 정보 입력 방법
JP6923332B2 (ja) 自動通訳方法及び装置
JP5634860B2 (ja) 第2言語モードを有する入力メソッドエディタ
US20180341698A1 (en) Method and apparatus for parsing query based on artificial intelligence, and storage medium
CN112395385B (zh) 基于人工智能的文本生成方法、装置、计算机设备及介质
KR20210154705A (ko) 시맨틱 매칭 방법, 장치, 기기 및 저장 매체
WO2022001888A1 (zh) 基于词向量生成模型的信息生成方法和装置
KR20210157342A (ko) 언어 모델의 훈련 방법, 장치, 전자 기기 및 판독 가능 기록 매체
JP2021108098A (ja) レビュー情報の処理方法、装置、コンピュータ機器及び媒体
CN108986790A (zh) 语音识别联系人的方法和装置
CN109858045B (zh) 机器翻译方法和装置
CN110268472B (zh) 用于自动化对话系统的检测机构
CN107112009B (zh) 用于生成混淆网络的方法、系统和计算机可读存储设备
CN112860919B (zh) 基于生成模型的数据标注方法、装置、设备及存储介质
CN111508497B (zh) 语音识别方法、装置、电子设备及存储介质
KR20240067971A (ko) 음성 인식 방법, 음성 인식 장치, 전자장비, 저장매체 및 컴퓨터 프로그램
CN112509562A (zh) 用于文本后处理的方法、装置、电子设备和介质
WO2020052060A1 (zh) 用于生成修正语句的方法和装置
CN111783433A (zh) 一种文本检索纠错方法和装置
US20220254351A1 (en) Method and system for correcting speaker diarization using speaker change detection based on text
CN115688808A (zh) 翻译方法、装置、可读介质及电子设备
CN110728137B (zh) 用于分词的方法和装置
CN111126078B (zh) 翻译的方法和装置
CN114429629A (zh) 图像处理方法、装置、可读存储介质及电子设备
CN108682437B (zh) 信息处理方法、装置、介质和计算设备

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant