KR20210045960A - 정보 출력 방법, 장치, 기기 및 저장 매체 - Google Patents

정보 출력 방법, 장치, 기기 및 저장 매체 Download PDF

Info

Publication number
KR20210045960A
KR20210045960A KR1020210045332A KR20210045332A KR20210045960A KR 20210045960 A KR20210045960 A KR 20210045960A KR 1020210045332 A KR1020210045332 A KR 1020210045332A KR 20210045332 A KR20210045332 A KR 20210045332A KR 20210045960 A KR20210045960 A KR 20210045960A
Authority
KR
South Korea
Prior art keywords
sentence
chinese
translated
foreign language
variable
Prior art date
Application number
KR1020210045332A
Other languages
English (en)
Other versions
KR102531507B1 (ko
Inventor
멍자오 리
준 장
Original Assignee
베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. filed Critical 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디.
Publication of KR20210045960A publication Critical patent/KR20210045960A/ko
Application granted granted Critical
Publication of KR102531507B1 publication Critical patent/KR102531507B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/45Example-based machine translation; Alignment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/51Translation evaluation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3337Translation of the query language, e.g. Chinese to English
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90344Query processing by using string matching techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Machine Translation (AREA)

Abstract

본 발명은 정보 출력 방법, 장치, 기기 및 저장 매체를 개시하며, 웹 페이지 처리, 자연 언어 처리, 클라우드 컴퓨팅 처리 분야에 관한 것이다. 구체적인 구현 수단은, 번역할 문장을 획득하고; 기설정된 문장 페어 집합으로부터 번역할 문장과 매칭되는 외국어 문장을 결정하되, 문장 페어 집합은 중국어 문장 및 대응되는 외국어 문장을 포함하며; 번역할 문장 및 결정된 외국어 문장에 따라, 번역할 문장의 타깃 외국어 문장을 결정하고; 타깃 외국어 문장을 출력하는 것이다. 본 구현 방식은, 문장 페어 집합으로부터 번역할 문장과 매칭되는 외국어 문장을 결정할 수 있고, 또한 번역할 문장에 따라 외국어 문장에 대해 최적화하여, 획득된 타깃 번역 문장이 보다 유창해지도록 한다.

Description

정보 출력 방법, 장치, 기기 및 저장 매체{METHOD, DEVICE, EQUIPMENT AND STORAGE MEDIUM FOR OUTPUTTING INFORMATION}
본 발명은 컴퓨터 기술 분야에 관한 것으로, 구체적으로 웹 페이지 처리, 자연 언어 처리, 클라우드 컴퓨팅 분야에 관한 것이며, 특히 정보 출력 방법, 장치, 기기 및 저장 매체에 관한 것이다.
스마트 기기의 발전에 따라, 스마트 운영 체제도 점점 다양해지고 있고, 이러한 시스템을 통합한 스마트 기기도 점점 더 많은 사용자에게 사용되기 시작하며, 사용자는 이러한 기기로 게임, 소셜 네트워킹, 독서 등 일상 생활을 진행한다.
스마트 기기의 판매량이 나날이 증가함에 따라, 해외 사용자도 이러한 제품을 사용하는데, 그러면 이러한 제품을 제공하는 웹 페이지의 국제화가 필요하다. 그중에서 번역해야 하는 콘텐츠에는, 전단의 JavaScript로 렌더링된 표시 문안과 후단의 오류 정보 및 리턴 데이터가 포함된다. 기존의 번역 수단의 이러한 문장의 번역 결과는 매우 딱딱하다.
정보 출력 방법, 장치, 기기 및 저장 매체를 제공한다.
제1 양태에 따르면, 정보 출력 방법을 제공하되, 당해 방법은 번역할 문장을 획득하는 단계; 기설정된 문장 페어 집합으로부터 번역할 문장과 매칭되는 외국어 문장을 결정하는 단계 - 문장 페어 집합은 중국어 문장 및 대응되는 외국어 문장을 포함함 -; 번역할 문장 및 결정된 외국어 문장에 따라, 번역할 문장의 타깃 외국어 문장을 결정하는 단계; 및 타깃 외국어 문장을 출력하는 단계를 포함한다.
제2 양태에 따르면, 정보 출력 장치를 제공하되, 상기 장치는 번역할 문장을 획득하도록 구성된 획득 유닛; 기설정된 문장 페어 집합으로부터 번역할 문장과 매칭되는 외국어 문장을 결정하도록 구성된 매칭 유닛 - 문장 페어 집합은 중국어 문장 및 대응되는 외국어 문장을 포함함 -; 번역할 문장 및 결정된 외국어 문장에 따라, 번역할 문장의 타깃 외국어 문장을 결정하도록 구성된 결정 유닛; 및 타깃 외국어 문장을 출력하도록 구성된 출력 유닛을 포함한다.
제3 양태에 따르면, 적어도 하나의 프로세서; 및 상기 적어도 하나의 프로세서와 통신 연결되는 메모리를 포함하는 정보를 출력하기 위한 전자 기기를 제공하되, 메모리에 적어도 하나의 프로세서에 의해 실행 가능한 명령이 저장되고, 상기 명령이 적어도 하나의 프로세서에 의해 실행되어, 적어도 하나의 프로세서가 제1 양태에 따른 방법을 수행할 수 있도록 한다.
제4 양태에 따르면, 컴퓨터 명령이 저장된 비일시적 컴퓨터 판독 가능 저장 매체를 제공하되, 상기 컴퓨터 명령은 상기 컴퓨터가 제1 양태에 따른 방법을 수행하도록 한다.
본 발명의 기술에 따르면, 문장 페어 집합으로부터 번역할 문장과 매칭되는 외국어 문장을 결정할 수 있고, 또한 번역할 문장에 따라 외국어 문장에 대해 최적화하여, 획득된 타깃 번역 문장이 보다 유창해지도록 한다.
본 부분에서 설명된 내용은 본 발명의 실시예의 핵심 또는 중요한 특징을 식별하기 위한 것이 아니며, 본 발명의 범위를 한정하려는 의도도 아님을 이해해야 할 것이다. 본 발명의 다른 특징은 아래 명세서에 의해 쉽게 이해될 것이다.
도면은 본 해결수단을 더 잘 이해하기 위한 것으로, 본 발명에 대해 한정하는 것으로 구성되지 않는다.
도 1은 본 발명의 일 실시예가 적용될 수 있는 예시적 시스템 아키텍처이다.
도 2는 본 발명에 따른 정보 출력 방법의 일 실시예의 흐름도이다.
도 3은 본 발명에 따른 정보 출력 방법의 일 응용 상황의 모식도이다.
도 4는 본 발명에 따른 정보 출력 방법의 다른 일 실시예의 흐름도이다.
도 5는 본 발명에 따른 정보 출력 방법의 다른 일 실시예의 흐름도이다.
도 6은 본 발명에 따른 정보 출력 방법에서 문장 페어 집합을 결정하는 흐름도이다.
도 7은 본 발명에 따른 정보 출력 장치의 일 실시예의 구조 모식도이다.
도 8은 본 발명의 실시예의 정보 출력 방법을 구현하기 위한 전자 기기의 블록도이다.
아래 첨부된 도면을 결부하여 본 발명의 예시적 실시예를 설명하되, 여기에는 이해를 돕기 위한 본 발명의 실시예의 다양한 세부 사항이 포함되며, 이는 단지 예시적인 것으로 간주되어야 한다. 따라서, 본 기술분야의 통상의 기술자는 본 발명의 범위와 사상을 벗어나지 않으면서, 여기서 설명되는 실시예에 대한 다양한 변경과 수정이 이루어질 수 있음을 이해해야 한다. 마찬가지로, 명확성 및 간결성을 위해, 아래의 설명에서 공지된 기능과 구조에 대한 설명을 생략한다.
모순되지 않는 한 본 발명의 실시예 및 실시예의 특징은 서로 조합될 수 있음을 유의해야 한다. 아래 첨부 도면을 참조하고 실시예를 참조하여 본 발명을 상세히 설명하기로 한다.
도 1은 본 발명의 정보 출력 방법 또는 정보 출력 장치의 실시예가 적용될 수 있는 예시적 시스템 아키텍처(100)를 도시한다.
도 1에 도시된 바와 같이, 시스템 아키텍처(100)는 단말 기기(101, 102, 103), 네트워크(104) 및 서버(105)를 포함할 수 있다. 네트워크(104)는 단말 기기(101, 102, 103)와 서버(105) 사이에서 통신 링크의 매체를 제공한다. 네트워크(104)는 다양한 연결 타입을 포함할 수 있는 바, 예를 들어 유선, 무선 통신 링크 또는 광섬유 케이블 등이다.
사용자는 단말 기기(101, 102, 103)를 사용하여 네트워크(104)를 통해 서버(105)와 인터랙션함으로써 메시지 등을 수신 또는 송신할 수 있다. 단말 기기(101, 102, 103)에는 다양한 통신 클라이언트 애플리케이션이 설치될 수 있는 바, 예를 들어 웹페이지 브라우징 애플리케이션, 쇼핑 애플리케이션, 소셜 플랫폼 애플리케이션, 음성 인식 애플리케이션 등이다.
단말 기기(101, 102, 103)는 하드웨어일 수 있고 소프트웨어일 수도 있다. 단말 기기(101, 102, 103)가 하드웨어인 경우, 다양한 전자 기기일 수 있으며, 스마트폰, 전자 리더, 차량용 컴퓨터, 랩톱 및 데스크톱 등을 포함하나 이에 한정되는 것은 아니다. 단말 기기(101, 102, 103)가 소프트웨어인 경우, 상기 열거된 전자 기기에 설치될 수 있다. 다수의 소프트웨어 또는 소프트웨어 모듈(예를 들어 분산형 서비스를 제공함)로 구현되거나, 하나의 소프트웨어 또는 소프트웨어 모듈로 구현될 수 있다. 여기서는 구체적으로 한정하지 않는다.
서버(105)는 다양한 서비스를 제공하는 서버일 수 있고, 예를 들어 단말 기기(101, 102, 103)에서 리턴된 웹 페이지 중 문장에 대해 번역하는 백그라운드 서버일 수 있다. 백그라운드 서버는 사용자에게 리턴된 웹 페이지를 획득할 수 있고, 웹 페이지 중 문장에 대해 번역하고, 번역된 외국어 문장을 단말 기기(101, 102, 103)에 피드백할 수 있다.
설명해야 할 것은, 서버(105)는 하드웨어 또는 소프트웨어일 수 있다. 서버(105)가 하드웨어인 경우, 다수의 서버로 구성된 분산형 서버 클러스터로 구현될 수 있고, 하나의 서버로 구현될 수도 있다. 서버(105)가 소프트웨어인 경우, 다수의 소프트웨어 또는 소프트웨어 모듈(예를 들어 분산형 서비스를 제공함)로 구현되거나, 하나의 소프트웨어 또는 소프트웨어 모듈로 구현될 수 있다. 여기서는 구체적으로 한정하지 않는다.
설명해야 할 것은, 본 발명의 실시예에서 제공된 정보 출력 방법은 일반적으로 서버(105)에 의해 수행될 수 있다. 대응되게, 정보 출력 장치는 일반적으로 서버(105)에 설치될 수 있다.
이해해야 할 것은 도 1 중의 단말 기기, 네트워크 및 서버의 개수는 예시적인 것일 뿐이다. 실제 필요에 따라 임의의 개수의 단말 기기, 네트워크 및 서버를 구비할 수 있다.
계속하여 도 2를 참조하면, 본 발명에 따른 정보 출력 방법의 일 실시예의 흐름(200)을 도시한다. 본 실시예의 정보 출력 방법은 하기와 같은 단계를 포함한다.
단계(201)에서, 번역할 문장을 획득한다.
본 실시예에서, 정보 출력 방법의 수행 주체(예를 들어 도 1에 도시된 서버(105))는 다양한 방식을 통해 번역할 문장을 획득할 수 있다. 상기 번역할 문장은 사용자에 의해 수행 주체에 송신된 것일 수 있고, 검색 엔진에 의해 수행 주체에 리턴된 것일 수도 있다. 상기 번역할 문장은 적어도 하나의 중국어 캐릭터를 포함할 수 있다.
단계(202)에서, 기설정된 문장 페어 집합으로부터 번역할 문장과 매칭되는 외국어 문장을 결정한다.
수행 주체는 번역할 문장을 획득한 후, 기설정된 문장 페어 집합으로부터 번역할 문장과 매칭되는 외국어 문장을 결정할 수 있다. 여기서, 문장 페어 집합은 다수의 문장 페어를 포함할 수 있고, 각각의 문장 페어는 중국어 문장 및 이에 대응되는 외국어 문장을 포함하며, 외국어 문장은 영어 문장, 러시아어 문장, 독일어 문장 등 다수를 포함할 수 있다. 수행 주체는 번역할 문장과 문장 페어 집합 내 각 중국어 문장을 비교하여, 번역할 문장과 매칭되는 중국어 문장을 결정할 수 있다. 비교할 경우, 수행 주체는 번역할 문장과 문장 페어 집합 내 각 중국어 문장의 유사도를 계산할 수 있으며, 유사도가 가장 큰 중국어 문장을 번역할 문장과 매칭되는 중국어 문장으로 사용한다. 다음, 상기 중국어 문장에 대응되는 외국어 문장을, 번역할 문장과 매칭되는 외국어 문장으로 사용한다.
단계(203)에서, 번역할 문장 및 결정된 외국어 문장에 따라, 번역할 문장의 타깃 외국어 문장을 결정한다.
본 실시예에서, 번역할 문장은 변수를 포함할 수 있고, 이러한 변수의 값은 변화된다. 문장 페어 집합 중 외국어 문장 중 변수 값은 고정되거나 공백이다. 따라서, 수행 주체는 번역할 문장 중 변수로 결정된 외국어 문장 중 변수 값을 대체하여, 외국어 문장을 획득할 수 있다. 예를 들어, 번역할 문장은 "A + '중' + B + '의 데이터 포맷 오류'"이고, 여기서 "A"와 "B"는 변수이다. JavaScript에서, 변수는 데이터 값을 저장하는 컨테이너이다. 매칭되는 외국어 문장은 "'Data in the C of D format error'"이고, 여기서 "C"와 "D"도 변수이다. 이경우, 수행 주체는 외국어 문장 중 "C"와 "D"를 "A"와 "B"로 대체하여, 타깃 외국어 문장 "'Data in the B of A format error'"를 획득할 수 있다.
단계(204)에서, 타깃 외국어 문장을 출력한다.
수행 주체는 타깃 외국어 문장을 획득한 후, 사용자가 브라우징하도록 타깃 외국어 문장을 출력할 수 있다.
계속하여 도 3을 참조하면, 본 발명에 따른 정보 출력 방법의 일 응용 상황의 모식도를 도시한다. 도 3의 응용 상황에서, 사용자는 단말기(301)의 브라우저를 통해 특정 제품의 웹 페이지를 브라우징하지만, 브라우징 과정에서 오류가 발생한다. 서버(302)는 브라우저에 의해 리턴된 웹 페이지 중 문장을 번역할 문장으로 사용할 수 있다. 번역할 문장은 "A + '중' + B + '의 데이터 포맷 오류'"이고, 단계(202) 내지 단계(203)으로 처리한 후, 타깃 외국어 문장 "'Data in the B of A format error'"가 획득된다. 서버(302)는 상기 타깃 외국어 문장을 브라우저에 의해 리턴된 웹 페이지에 디스플레이할 수 있다.
본 발명의 상기 실시예에서 제공된 정보 출력 방법은, 문장 페어 집합으로부터 번역할 문장과 매칭되는 외국어 문장을 결정하고, 또한 번역할 문장에 따라 외국어 문장에 대해 최적화하여, 획득된 타깃 번역 문장이 보다 유창해지도록 한다.
계속하여 도 4를 참조하면, 본 발명에 따른 정보 출력 방법의 다른 일 실시예의 흐름(400)을 도시한다. 도 4에 도시된 바와 같이, 본 실시예에서, 정보 출력 방법은 하기와 같은 단계를 포함할 수 있다.
단계(401)에서, 사용자의 웹 페이지 액세스 요청을 수신한 것에 응답하여, 웹 페이지 액세스 요청 대상 웹 페이지 중 문장을 번역할 문장으로 사용한다.
본 실시예에서, 수행 주체는 사용자의 웹 페이지 액세스 요청을 수신할 수 있다. 상기 웹 페이지 액세스 요청은 특정된 웹 페이지를 액세스하도록 요청하기 위한 것이다. 수행 주체는 웹 페이지 액세스 요청 대상 웹 페이지 중 문장을 번역할 문장으로 사용할 수 있다.
단계(402)에서, 번역할 문장 중 제1 변수 및 제1 중국어 단어를 결정한다.
수행 주체는 상기 번역할 문장 중 변수 및 중국어 단어를 결정할 수 있는 바, 상기 변수를 제1 변수로 표기하고, 상기 중국어 단어를 제1 중국어 단어로 표기한다. 변수가 결정된 경우, 수행 주체는 컴퓨터 편집 언어에 따라 그중의 변수를 결정할 수 있다. JavaScript의 경우, 작은 따옴표로 표시되지 않은 파라미터는 변수로 간주할 수 있다. 수행 주체는 기존의 중국어 인식 알고리즘을 통해 번역할 문장 중 중국어 단어를 인식할 수 있다.
단계(403)에서, 문장 페어 집합 내 각 중국어 문장 중 제2 변수 및 제2 중국어 단어를 결정한다.
마찬가지로, 수행 주체는 문장 페어 집합 내 각 중국어 문장 중 변수 및 중국어 단어를 결정할 수 있다. 또한 상기 변수를 제2 변수로 표기하고, 상기 중국어 단어를 제2 중국어 단어로 표기한다. 일부 구체적인 응용에서, 수행 주체는 각 중국어 문장에 대해 한번만 분석한 다음, 획득된 제2 변수 및 제2 중국어 단어를 다음에 사용하도록 보존할 수 있다.
단계(404)에서, 제1 변수, 제1 중국어 단어, 각 제1 중국어 단어 및 각 제2 중국어 단어에 따라, 문장 페어 집합으로부터 번역할 문장과 매칭되는 중국어 문장을 결정한다.
제1 변수, 제1 중국어 단어, 각 제1 중국어 단어 및 각 제2 중국어 단어가 결정된 후, 수행 주체는 문장 페어 집합으로부터 상기 번역할 문장과 매칭되는 중국어 문장을 결정할 수 있다. 구체적으로, 수행 주체는 제2 중국어 단어가 제1 중국어 단어와 동일한 중국어 문장을 번역할 문장과 매칭되는 중국어 문장으로 사용할 수 있다.
본 실시예의 일부 선택 가능한 구현 방식에서, 상기 단계(404)는 구체적으로 도 4에 도시되지 않은, 번역할 문장 중 제1 변수의 제1 위치 정보를 결정하는 단계; 문장 페어 집합 내 각 중국어 문장 중 각 제2 변수의 제2 위치 정보를 결정하는 단계; 및 제1 위치 정보, 각 제2 위치 정보, 제1 중국어 단어 및 각 제2 중국어 단어에 따라, 문장 페어 집합으로부터 번역할 문장과 매칭되는 중국어 문장을 결정하는 단계에 의해 구현될 수 있다.
본 구현 방식에서, 수행 주체는 번역할 문장 중 제1 변수의 제1 위치 정보를 결정할 수 있다. 여기서, 제1 위치 정보는 하나의 값으로, 제1 변수와 번역할 문장의 첫 캐릭터 사이의 거리를 나타낼 수 있다. 마찬가지로, 수행 주체는 또한 문장 페어 집합 내 각 중국어 문장 중 각 제2 변수의 제2 위치 정보를 결정할 수 있다. 다음, 수행 주체는 제1 위치 정보, 각 제2 위치 정보, 제1 중국어 단어 및 각 제2 중국어 단어에 따라, 번역할 문장과 매칭되는 외국어 문장을 결정할 수 있다. 구체적으로, 수행 주체는 문장 페어 집합 내 각 중국어 문장으로부터 제2 중국어 단어가 제1 중국어 단어와 동일하고, 또한 제2 위치 정보가 제1 위치 정보와 동일한 중국어 문장을 결정할 수 있다.
단계(405)에서, 결정된 중국어 문장에 대응되는 외국어 문장을, 번역할 문장과 매칭되는 외국어 문장으로 사용한다.
중국어 문장이 결정된 후, 수행 주체는 상기 중국어 문장에 대응되는 외국어 문장을, 번역할 문장과 매칭되는 외국어 문장으로 사용할 수 있다.
단계(406)에서, 제1 변수로 매칭된 외국어 문장 중 제2 변수를 대체하여, 타깃 외국어 문장을 획득한다.
다음, 수행 주체는 번역할 문장 중 제1 변수로 매칭된 외국어 문장 중 제2 변수를 대체하여, 타깃 외국어 문장을 획득할 수 있다.
본 발명의 상기 실시예에서 제공된 정보 출력 방법은, 번역할 문장 중 변수의 위치, 중국어 단어 및 문장 페어 집합 내 각 중국어 문장 중 변수의 위치 및 중국어 단어에 따라, 번역할 문장과 매칭되는 외국어 문장을 정확하게 결정할 수 있음으로써, 번역의 정확성을 향상시킨다.
계속하여 도 5를 참조하면, 본 발명에 따른 정보 출력 방법의 다른 일 실시예의 흐름(500)을 도시한다. 본 실시예에서, 수행 주체는 하기와 같은 단계를 포함할 수 있다.
단계(501)에서, 번역할 문장을 획득한다.
단계(502)에서, 번역할 문장을 분할하여, 적어도 2개의 서브 문장을 획득한다.
본 실시예에서, 수행 주체는 번역할 문장이 획득된 후, 번역할 문장을 분할하여, 적어도 2개의 서브 문장을 획득할 수 있다. 구체적으로, 수행 주체는 다양한 부호에 따라 번역할 문장을 분할할 수 있다. 상기 부호는 ':', ',', '||', '.', '。', ','、';', '; ', 괄호 타입 부호 '( )', '( )', '{ }', '「 」', ' [ ]', '< >'를 포함할 수 있지만 이에 한정되지 않는다. 예를 들어, 번역할 문장이 "도표「A」 사이에 순환 의존이 형성되므로, 의존 구성을 변경하십시오!"이면, 분할한 후 각 서브 문장은 "도표", "사이에 순환 의존이 형성되므로" 및 "의존 구성을 변경하십시오"를 포함할 수 있다.
단계(503)에서, 문장 페어 집합으로부터 적어도 2개의 서브 문장과 매칭되는 외국어 문장을 각각 결정한다.
본 실시예에서, 수행 주체는 문장 페어 집합으로부터 적어도 2개의 서브 문장과 매칭되는 외국어 문장을 각각 결정할 수 있다. 결정 방식은 단계(402) 내지 단계(405)에 나타낸 방식으로 결정될 수 있다.
단계(504)에서, 번역할 문장 및 결정된 외국어 문장에 따라, 번역할 문장의 타깃 외국어 문장을 결정한다.
본 실시예에서, 수행 주체는 각 서브 문장과 매칭되는 외국어 문장이 획득된 후, 번역할 문장 중 각 서브 문장의 위치에 따라, 번역할 문장에 대해 스티칭을 수행할 수 있다. 동시에 번역할 문장 중 변수를 스티칭된 외국어 문장에 삽입하여, 타깃 외국어 문장을 획득할 수 있다.
단계(505)에서, 타깃 외국어 문장을 출력한다.
설명해야 할 것은, 본 실시예의 방법은, 도 4에 도시된 실시예를 사용하여 매칭되는 외국어 문장이 결정되지 않은 경우에 사용될 수 있으며, 단계(502)에서의 문장 분할은 또한 제1 변수에 따라, 번역할 문장을 분할하여, 적어도 2개의 서브 문장을 획득할 수 있다.
예를 들어, 번역할 문장이 "'SQL 중' + (A '문장 중''(제' + B + '행)': '') + '불법 키워드가 나타남' + C"이다. 따라서 각 서브 문장은 "SQL 중", "문장 중"제" "행"불법 키워드가 나타남"을 포함할 수 있다.
본 발명의 상기 실시예에서 제공된 정보 출력 방법은 번역의 정확성을 더 향상시킬 수 있다.
계속하여 도 6을 참조하면, 본 발명에 따른 정보 출력 방법에서 문장 페어 집합을 결정하는 일 실시예의 흐름(600)을 도시한다. 도 6에 도시된 바와 같이, 본 실시예에서, 하기와 같은 단계에 의해 문장 페어 집합을 획득할 수 있다.
단계(601)에서, 중국어 문장 집합을 획득한다.
본 실시예에서, 수행 주체는 우선 중국어 문장 집합을 획득할 수 있다. 여기서 중국어 문장 집합 내 각 중국어 문장은 전단 웹 페이지에 표시된 문장 및 후단에 리턴된 문장을 포함할 수 있다.
단계(602)에서, 중국어 문장 집합 내 각 중국어 문장 중 제3 변수 및 제3 중국어 단어를 결정한다.
수행 주체는 중국어 문장 집합이 획득된 후, 중국어 문장 집합 내 각 중국어 문장 중 제3 변수 및 제3 중국어 단어를 결정할 수 있다.
단계(603)에서, 각 중국어 문장에 제3 변수를 표기하고, 표기된 각 중국어 문장을 출력하여, 각 중국어 문장 중 제3 중국어 단어를 번역하도록 한다.
구체적으로, 번역할 문장 중 변수가 결정된 후, 우선 대칭되는 부호로 변수를 표기할 수 있다. 상기 대칭되는 부호는 "[" 및 "]", "<" 및 ">", "「" 및 "」"를 포함할 수 있다. 이해할 수 있는 것은, 상기 대칭되는 부호는 컴퓨터 프로그래밍 언어에서 사용되지 않는 부호일 수 있다. 예를 들어, 번역할 문장이 "A + '중' + B + '의 데이터 포맷 오류'"이면, "「" 및 "」"를 사용하여 변수에 대해 표기하여, "'「' + A + '」' + '중「' + B + '」의 데이터 포맷 오류'"를 획득한다.
변수가 표기된 후, 기설정된 부호로 변수를 대체한 다음, 다른 번역할 단어를 추출할 수 있다. 여전히 상기 문장을 예로, [%%0%%]를 사용하여 변수 A를 가리키고, [%%1%%]를 사용하여 변수 B를 가리킨다. 다음 작은 따옴표를 인용한 부분 중의 중국어 단어를 추출하여, 하기 문장 "'[%%0%%] 중 [%%1%%]의 데이터 포맷 오류'"를 획득한다. 수행 주체는 번역자가 각 중국어 문장 중 제3 중국어 단어를 번역하도록 상기 문장을 번역자에게 출력할 수 있다.
일부 경우, 번역할 문장에 변수가 내포된 경우가 존재하면, 이경우 각 변수가 표기된 후, 거리가 가장 가까운 "「" 및 "」"로부터 시작하여 "「" 및 "」"가 없을 때까지 매칭해야 한다. 거리의 경우, 번역할 문장은 "'SQL 중' + (A? '(제' + B + '행)': '') + '불법 키워드가 나타남' + C"이다. 변수 C를 제외한 외, A? '(제' + B + '행)' : ''가 하나의 조건 연산자 문장인 것을 볼 수 있는데, 이는 수행 결과가 B가 진짜인지 여부에 의해 결정되기 때문에, 수행될 경우에만 구체적인 값을 결정할 수 있으므로, 이 전체를 하나의 변수로 간주할 수 있으며, 양단에 특수 부호 "「" 및 "」"를 추가해야 한다. 이 변수 전체 내부에 하나의 변수 B가 더 존재하며, 마찬가지로 양단에 특수 부호를 추가하여, 문장 1"'SQL 중「' + (A? '(제「' + B + '」행)': '') + '」불법 키워드가 나타남「' + C + '」'"를 획득한다.
문장 1에, 내포된 "「" 및 "」" 구조가 있음을 볼 수 있으며, 번역할 단어를 추출할 경우, 최소의 "「" 및 "」" 구조로부터 교체하기 시작한다. 첫 번째 검색에서, 최소의 "「" 및 "」" 구조가 '「' + B + '「' 및 '「' + C + '「'인 것을 발견할 수 있는데, '「' + B + '「' 및 '「' + C + '「' 내부에 캐릭터가 없고, 단순한 변수 명칭만 있으므로, 먼저 이들을 '[%%0%%]'로 모두 교체한다. '「%%1%%」' 대신 '[%%0%%]'를 사용하는 이유는, 이후에 외부층 거리가 가장 작은 "「" 및 "」" 구조를 쉽게 찾아, 문장 2"'SQL 중「' + (A? '(제[%%0%%]행)': '') + '」불법 키워드가 나타남[%%0%%]'"를 획득하기 위해서이다.
이어서 외부층에서 가장 작은 "「" 및 "」" 구조를 찾는데, 이경우 찾을 수 있는 것은 '「' + (A? '(제[%%0%%]행)': '') + '」'이고, 이경우 내부에는 문자열 '(제[%%0%%]행)' 및 빈 문자열''이 있으며, 문자열 '(제[%%0%%]행)' 중 모든 [%%0%%]를 '「%%i%%」'로 교체하되, 여기서 i는 0부터 시작하여 증가하는 숫자이고, 교체된 '(제「%%0%%」행)'을 번역할 단어로 추출한다.
다음, 매칭된 "「" 및 "」" 구조 '「' + (A? '(제[%%0%%]행)': '') + '」'를 '[%%0%%]'로 교체하여 문장 3"'SQL 중[%%0%%]불법 키워드가 나타남[%%0%%]'"을 획득한다.
계속하여 외부층에서 가장 작은 "「" 및 "」" 구조를 찾은 결과, 발견되지 않았는데, 이는 이때 내포된 "「" 및 "」" 구조가 존재하지 않는다는 것을 설명하며, 내포 구조 내부의 추출할 단어도 모두 추출되었으므로, "「" 및 "」" 구조를 더 계속하여 찾을 필요가 없으며, 회귀적 로직이 종료된다.
이어서, 내포 구조가 없는 문장 3 중 [%%0%%]를 '「%%i%%」'로 교체하되, 여기서 i는 0부터 시작하여 증가하는 숫자이고, 문장 4"'SQL 중「%%0%%」불법 키워드가 나타남「%%1%%」'"를 획득한다. 문장 4를 번역할 단어로 추출하면서, 추출 로직이 종료된다.
설명해야 할 것은, 도 2에 도시된 실시예에서, 수행 주체는 또한 번역할 문장 중 변수에 대해 표기할 수 있으며, 다음 문장 페어 집합으로부터 표기된 문장과 매칭되는 외국어 문장을 결정한다.
단계(604)에서, 번역된 각 외국어 문장을 수신한다.
수행 주체는 또한 번역된 각 외국어 문장을 수신할 수 있다. 여기서 외국어 문장은 번역자가 표기된 중국어 문장에 따라 번역한 것이므로, 번역 결과는 더 유창하고 언어 환경에 더 부합된다.
단계(605)에서, 각 중국어 문장 및 대응되는 각 외국어 문장을 문장 페어로서 문장 페어 집합에 추가한다.
마지막에, 수행 주체는 중국어 문장 및 대응되는 외국어 문장을 문장 페어로 사용하여, 각 문장 페어를 문장 페어 집합에 추가할 수 있다.
본 발명의 상기 실시예에서 제공된 정보 출력 방법은, 인위적으로 번역한 외국어 문장과 대응되는 중국어 문장을 문장 페어로서 문장 페어 집합에 추가함으로써, 리턴된 외국어 문장이 보다 표준적이고 유창해질 수 있도록 한다.
또한 도 7을 참조하면, 상기 각 도면에 도시된 방법의 구현으로서, 본 발명은 정보 출력 장치의 일 실시예를 제공하며, 상기 장치 실시예는 도 2에 도시된 방법 실시예와 대응되고, 상기 장치는 구체적으로 다양한 전자 기기에 적용될 수 있다.
도 7에 도시된 바와 같이, 본 실시예의 출력 정보 장치(700)는 획득 유닛(701), 매칭 유닛(702), 결정 유닛(703) 및 출력 유닛(704)을 포함한다.
획득 유닛(701)은, 번역할 문장을 획득하도록 구성된다.
매칭 유닛(702)은, 기설정된 문장 페어 집합으로부터 번역할 문장과 매칭되는 외국어 문장을 결정하도록 구성된다. 여기서, 문장 페어 집합은 중국어 문장 및 대응되는 외국어 문장을 포함한다.
결정 유닛(703)은, 번역할 문장 및 결정된 외국어 문장에 따라, 번역할 문장의 타깃 외국어 문장을 결정하도록 구성된다.
출력 유닛(704)은, 타깃 외국어 문장을 출력하도록 구성된다.
본 실시예의 일부 선택 가능한 구현 방식에서, 매칭 유닛(702)은 도 7에 도시되지 않은, 제1 결정 모듈, 제2 결정 모듈, 제1 매칭 모듈 및 제2 매칭 모듈을 더 포함할 수 있다.
제1 결정 모듈은, 번역할 문장 중 제1 변수 및 제1 중국어 단어를 결정하도록 구성된다.
제2 결정 모듈은, 문장 페어 집합 내 각 중국어 문장 중 제2 변수 및 제2 중국어 단어를 결정하도록 구성된다.
제1 매칭 모듈은, 제1 변수, 제1 중국어 단어, 각 제1 중국어 단어 및 각 제2 중국어 단어에 따라, 문장 페어 집합으로부터 번역할 문장과 매칭되는 중국어 문장을 결정하도록 구성된다.
제2 매칭 모듈은, 결정된 중국어 문장에 대응되는 외국어 문장을, 번역할 문장과 매칭되는 외국어 문장으로 사용하도록 구성된다.
본 실시예의 일부 선택 가능한 구현 방식에서, 제1 매칭 모듈은 또한, 번역할 문장 중 제1 변수의 제1 위치 정보를 결정하고; 문장 페어 집합 내 각 중국어 문장 중 각 제2 변수의 제2 위치 정보를 결정하며; 제1 위치 정보, 각 제2 위치 정보, 제1 중국어 단어 및 각 제2 중국어 단어에 따라, 문장 페어 집합으로부터 번역할 문장과 매칭되는 중국어 문장을 결정하도록 구성될 수 있다.
본 실시예의 일부 선택 가능한 구현 방식에서, 결정 유닛(703)은 도 7에 도시되지 않은, 문장 분할 모듈 및 제3 결정 모듈을 더 포함할 수 있다.
문장 분할 모듈은, 번역할 문장을 분할하여, 적어도 2개의 서브 문장을 획득하도록 구성된다.
제3 결정 모듈은, 문장 페어 집합으로부터 적어도 2개의 서브 문장과 매칭되는 외국어 문장을 각각 결정하도록 구성된다.
본 실시예의 일부 선택 가능한 구현 방식에서, 문장 분할 모듈은 또한, 제1 변수에 따라, 번역할 문장을 분할하여, 적어도 2개의 서브 문장을 획득하도록 구성된다.
본 실시예의 일부 선택 가능한 구현 방식에서, 결정 유닛(703)은 또한, 제1 변수로 매칭된 외국어 문장 중 제2 변수를 대체하여, 타깃 외국어 문장을 획득하도록 구성될 수 있다.
본 실시예의 일부 선택 가능한 구현 방식에서, 획득 유닛(701)은 또한, 사용자의 웹 페이지 액세스 요청을 수신한 것에 응답하여, 웹 페이지 액세스 요청 대상 웹 페이지 중 문장을 번역할 문장으로 사용하도록 구성될 수 있다.
본 실시예의 일부 선택 가능한 구현 방식에서, 장치(700)는 도 7에 도시되지 않은, 구축 유닛을 더 포함할 수 있으며, 구축 유닛은, 중국어 문장 집합을 획득하고; 중국어 문장 집합 내 각 중국어 문장 중 제3 변수 및 제3 중국어 단어를 결정하며; 각 중국어 문장에 제3 변수를 표기하고, 각 중국어 문장 중 제3 중국어 단어를 번역하기 위해, 표기된 각 중국어 문장을 출력하고; 번역된 각 외국어 문장을 수신하며; 각 중국어 문장 및 대응되는 각 외국어 문장을 문장 페어로서 문장 페어 집합에 추가하도록 구성된다.
이해해야 할 것은, 정보 출력 장치(700)에 기재된 유닛(701) 내지 유닛(704)은 각각 도 2를 참조하여 설명된 방법 중 각각의 단계와 대응된다. 이로써, 위에서 정보 출력 방법에 대해 설명된 동작 및 특징은 마찬가지로 장치(700) 및 그중에 포함된 유닛에 적용되며, 여기서 더이상 서술하지 않는다.
본 발명의 실시예에 따르면, 본 발명은 전자 기기 및 판독 가능 저장 매체를 더 제공한다.
도 8에 도시된 바와 같이, 본 발명의 실시예의 정보 출력 방법에 따른 전자 기기의 블록도이다. 전자 기기는 랩톱 컴퓨터, 데스크톱 컴퓨터, 워크 스테이션, 개인용 정보 단말기, 서버, 블레이드 서버, 메인프레임 컴퓨터, 및 기타 적합한 컴퓨터와 같은 다양한 형태의 디지털 컴퓨터를 나타내기 위한 것이다. 전자 기기는 개인용 디지털 처리, 셀룰러 폰, 스마트 폰, 웨어러블 기기, 및 기타 유사한 컴퓨팅 장치와 같은 다양한 형태의 모바일 장치를 나타낼 수도 있다. 본문에 표시된 부재, 이들의 연결 및 관계, 및 이들의 기능은 단지 예시적인 것으로서, 본문에서 설명되거나 및/또는 요구되는 본 발명의 구현을 한정하려는 의도가 아니다.
도 8에 도시된 바와 같이, 상기 전자 기기는, 하나 또는 다수의 프로세서(801), 메모리(802), 및 고속 인터페이스 및 저속 인터페이스를 포함하는 각 부재를 연결하기 위한 인터페이스를 포함한다. 각각의 부재는 상이한 버스를 사용하여 상호 연결되고, 또한 공통 마더보드에 설치되거나 수요에 따라 다른 방식으로 설치될 수 있다. 프로세서는 전자 기기 내에서 실행되는 명령을 처리할 수 있고, 상기 명령은, 외부 입력/출력 장치(예를 들어, 인터페이스에 결합된 디스플레이 기기)에 GUI의 그래픽 정보를 디스플레이하기 위해 메모리 내 또는 메모리에 저장되는 명령을 포함한다. 다른 실시형태에서, 수요되면, 다수의 프로세서 및/또는 다수의 버스를 다수의 메모리와 함께 사용할 수 있다. 마찬가지로, 다수의 전자 기기를 연결할 수 있으며, 각각의 기기는 일부 필요한 동작(예를 들어, 서버 어레이, 한 그룹의 블레이드 서버, 또는 다중 프로세서 시스템으로 사용됨)을 제공한다. 도 8에서는 하나의 프로세서(801)를 예로 한다.
메모리(802)는 본 발명에서 제공된 비일시적 컴퓨터 판독 가능 저장 매체이다. 여기서, 상기 메모리에 적어도 하나의 프로세서에 의해 실행 가능한 명령이 저장되어, 상기 적어도 하나의 프로세서가 본 발명에서 제공된 정보 출력 방법을 수행하도록 한다. 본 발명의 비일시적 컴퓨터 판독 가능 저장 매체는 컴퓨터 명령을 저장하며, 상기 컴퓨터 명령은 컴퓨터가 본 발명에서 제공된 정보 출력 방법을 수행하도록 한다.
메모리(802)는 비일시적 컴퓨터 판독 가능 저장 매체로서, 본 발명의 실시예에서의 정보 출력 방법에 대응되는 프로그램 명령/모듈(예를 들어, 도 7에 도시된 획득 유닛(701), 매칭 유닛(702), 결정 유닛(703) 및 출력 유닛(704))과 같은 비일시적 소프트웨어 프로그램, 비일시적 컴퓨터 실행 가능 프로그램 및 모듈을 저장하는데 사용될 수 있다. 프로세서(801)는 메모리(702)에 저장된 비일시적 소프트웨어 프로그램, 명령 및 모듈을 실행함으로써, 서버의 다양한 기능 애플리케이션 및 데이터 처리를 수행하며, 즉 상기 방법의 실시예에서의 정보 출력 방법을 구현한다.
메모리(802)는 프로그램 저장 영역 및 데이터 저장 영역을 포함할 수 있는 바, 여기서 프로그램 저장 영역은 운영 체제, 적어도 하나의 기능에 필요한 애플리케이션 프로그램을 저장할 수 있고; 데이터 저장 영역은 정보를 출력하기 위한 전자 기기를 사용하여 구축된 데이터 등을 저장할 수 있다. 이밖에, 메모리(802)는 고속 랜덤 액세스 메모리를 포함할 수 있고, 적어도 하나의 자기 디스크 저장 소자, 플래시 소자, 또는 다른 비일시적 솔리드 스테이트 저장 소자와 같은 비일시적 메모리를 더 포함할 수 있다. 일부 실시예에서, 메모리(802)는 프로세서(801)에 대해 원격으로 설치되는 메모리를 선택적으로 포함할 수 있고, 이러한 원격 메모리는 네트워크를 통해 정보를 출력하기 위한 전자 기기에 연결될 수 있다. 상기 네트워크의 구현예는 인터넷, 기업 인트라넷, 근거리 통신망, 이동 통신망, 및 이들의 조합을 포함하지만 이에 한정되지 않는다.
정보 출력 방법을 수행하는 전자 기기는, 입력 장치(803) 및 출력 장치(804)를 더 포함할 수 있다. 프로세서(801), 메모리(802), 입력 장치(803) 및 출력 장치(804)는 버스 또는 다른 방식을 통해 연결될 수 있고, 도 8에서는 버스를 통한 연결을 예로 한다.
입력 장치(803)는 입력된 숫자 또는 캐릭터 정보를 수신할 수 있고, 정보를 출력하기 위한 전자 기기의 사용자 설정 및 기능 제어와 관련된 키 신호 입력을 생성할 수 있으며, 예를 들어 터치 스크린, 키패드, 마우스, 트랙 패드, 터치 패드, 포인팅 스틱, 하나 또는 다수의 마우스 버튼, 트랙볼, 조이스틱 등 입력 장치일 수 있다. 출력 장치(804)는 디스플레이 기기, 보조 조명 장치(예를 들어, LED) 및 촉각 피드백 장치(예를 들어, 진동 모터) 등을 포함할 수 있다. 상기 디스플레이 기기는 액정 디스플레이 장치(LCD), 발광 다이오드(LED) 디스플레이 장치 및 플라즈마 디스플레이 장치를 포함할 수 있으나 이에 한정되지 않는다. 일부 실시형태에서, 디스플레이 기기는 터치 스크린일 수 있다.
여기서 설명된 시스템 및 기술의 다양한 실시형태는 디지털 전자 회로 시스템, 집적 회로 시스템, 주문형 ASIC(주문형 집적 회로), 컴퓨터 하드웨어, 펌웨어, 소프트웨어, 및/또는 이들의 조합에서 구현될 수 있다. 이러한 다양한 실시형태는 하나 또는 다수의 컴퓨터 프로그램에서의 구현을 포함할 수 있고, 상기 하나 또는 다수의 컴퓨터 프로그램은 적어도 하나의 프로그램 가능 프로세서를 포함하는 프로그램 가능 시스템에서 실행 및/또는 해석될 수 있으며, 상기 프로그램 가능 프로세서는 주문형 또는 일반 프로그램 가능 프로세서일 수 있고, 저장 시스템, 적어도 하나의 입력 장치 및 적어도 하나의 출력 장치로부터 데이터 및 명령을 수신할 수 있으며, 또한, 데이터 및 명령을 상기 저장 시스템, 상기 적어도 하나의 입력 장치 및 상기 적어도 하나의 출력 장치에 전송할 수 있다.
이러한 컴퓨팅 프로그램(프로그램, 소프트웨어, 소프트웨어 애플리케이션 또는 코드로 지칭되기도 함)은 프로그램 가능 프로세서의 기계 명령을 포함하고, 또한 고급 프로세스 및/또는 객체 지향 프로그래밍 언어, 및/또는 어셈블리/기계 언어를 사용하여 이러한 컴퓨팅 프로그램을 실행할 수 있다. 본문에 사용된 바와 같이, 용어 "기계 판독 가능 매체" 및 "컴퓨터 판독 가능 매체"는 기계 명령 및/또는 데이터를 프로그램 가능 프로세서에 제공하기 위한 임의의 컴퓨터 프로그램 제품, 기기 및/또는 장치(예를 들어, 자기 디스크, 광 디스크, 메모리, 프로그램 가능 논리 장치(PLD))를 의미하고, 기계 판독 가능 신호인 기계 명령을 수신하는 기계 판독 가능 매체를 포함한다. 용어 "기계 판독 가능 신호"는 기계 명령 및/또는 데이터를 프로그램 가능 프로세서에 제공하기 위한 임의의 신호를 의미한다.
사용자와의 인터랙션을 제공하기 위해, 컴퓨터에서 여기에 설명된 시스템 및 기술을 구현할 수 있고, 상기 컴퓨터는 사용자에게 정보를 디스플레이하기 위한 디스플레이 장치(예를 들어, CRT(음극선관) 또는 LCD(액정 표시 장치) 모니터); 및 키보드 및 포인팅 장치(예를 들어, 마우스 또는 트랙 볼)를 구비하며, 사용자는 상기 키보드 및 상기 포인팅 장치를 통해 컴퓨터에 입력을 제공한다. 다른 타입의 장치는 또한 사용자와의 인터랙션을 제공할 수 있는데, 예를 들어, 사용자에게 제공된 피드백은 임의의 형태의 센서 피드백(예를 들어, 예를 들어, 시각적 피드백, 청각적 피드백 또는 촉각적 피드백)일 수 있고; 임의의 형태(소리 입력, 음성 입력, 또는 촉각 입력)로 사용자로부터의 입력을 수신할 수 있다.
여기서 설명된 시스템 및 기술은 백엔드 부재를 포함하는 컴퓨팅 시스템(예를 들어, 데이터 서버로 사용됨), 또는 미들웨어 부재를 포함하는 컴퓨팅 시스템(예를 들어, 애플리케이션 서버), 또는 프론트 엔드 부재를 포함하는 컴퓨팅 시스템(예를 들어, 그래픽 사용자 인터페이스 또는 네트워크 브라우저를 구비하는 사용자 컴퓨터인 바, 사용자는 상기 그래픽 사용자 인터페이스 또는 상기 네트워크 브라우저를 통해 여기서 설명된 시스템 및 기술의 실시형태와 인터랙션할 수 있음), 또는 이러한 백엔드 부재, 미들웨어 부재, 또는 프론트 엔드 부재의 임의의 조합을 포함하는 컴퓨팅 시스템에서 구현될 수 있다. 임의의 형태 또는 매체의 디지털 데이터 통신(예를 들어, 통신 네트워크)을 통해 시스템의 부재를 서로 연결시킬 수 있다. 통신 네트워크의 예는, 근거리 통신망(LAN), 광역망(WAN), 인터넷을 포함한다.
컴퓨터 시스템은 클라이언트 및 서버를 포함할 수 있다. 클라이언트 및 서버는 일반적으로 서로 멀리 떨어져 있고, 일반적으로 통신 네트워크를 통해 서로 인터랙션한다. 대응되는 컴퓨터에서 실행되고 또한 서로 클라이언트-서버 관계를 가지는 컴퓨터 프로그램을 통해 클라이언트 및 서버의 관계를 생성한다.
본 발명의 실시예의 기술적 해결수단에 따르면, 문장 페어 집합으로부터 번역할 문장과 매칭되는 외국어 문장을 결정하고, 또한 번역할 문장에 따라 외국어 문장에 대해 최적화하여, 획득된 타깃 번역 문장이 보다 유창해지도록 한다.
위에서 설명된 다양한 형태의 프로세스를 사용하여 단계를 재배열, 추가 또는 삭제할 수 있음을 이해해야 한다. 예를 들어, 본 발명에 기재된 각 단계는 동시에, 순차적으로, 또는 상이한 순서로 수행될 수 있으며, 본 발명에 개시된 기술적 해결수단이 이루고자 하는 결과를 구현할 수 있는 한, 본문은 여기서 한정되지 않는다.
상기 구체적인 실시형태는 본 발명의 보호 범위를 한정하지 않는다. 본 기술분야의 통상의 기술자는, 설계 요구 및 다른 요소에 따라 다양한 수정, 조합, 서브 조합 및 대체를 진행할 수 있음을 이해해야 한다. 본 발명의 정신 및 원칙 내에서 이루어진 임의의 수정, 등가 교체 및 개선 등은 모두 본 발명의 보호 범위 내에 포함되어야 한다.

Claims (19)

  1. 정보 출력 방법으로서,
    번역할 문장을 획득하는 단계;
    기설정된 문장 페어(Sentence Pair) 집합으로부터 상기 번역할 문장과 매칭되는 외국어 문장을 결정하는 단계 - 상기 문장 페어 집합은 중국어 문장 및 대응되는 외국어 문장을 포함함 -;
    상기 번역할 문장 및 결정된 외국어 문장에 따라, 상기 번역할 문장의 타깃 외국어 문장을 결정하는 단계; 및
    상기 타깃 외국어 문장을 출력하는 단계를 포함하는 정보 출력 방법.
  2. 제1항에 있어서,
    상기 기설정된 문장 페어 집합으로부터 상기 번역할 문장과 매칭되는 외국어 문장을 결정하는 단계는,
    상기 번역할 문장 중 제1 변수 및 제1 중국어 단어를 결정하는 단계;
    상기 문장 페어 집합 내 각 중국어 문장 중 제2 변수 및 제2 중국어 단어를 결정하는 단계;
    상기 제1 변수, 상기 제1 중국어 단어, 각 상기 제1 중국어 단어 및 각 상기 제2 중국어 단어에 따라, 상기 문장 페어 집합으로부터 상기 번역할 문장과 매칭되는 중국어 문장을 결정하는 단계; 및
    결정된 중국어 문장에 대응되는 외국어 문장을, 상기 번역할 문장과 매칭되는 외국어 문장으로 사용하는 단계를 포함하는 정보 출력 방법.
  3. 제2항에 있어서,
    상기 제1 변수, 상기 제1 중국어 단어, 각 상기 제1 중국어 단어 및 각 상기 제2 중국어 단어에 따라, 상기 문장 페어 집합으로부터 상기 번역할 문장과 매칭되는 중국어 문장을 결정하는 단계는,
    상기 번역할 문장 중 상기 제1 변수의 제1 위치 정보를 결정하는 단계;
    상기 문장 페어 집합 내 각 중국어 문장 중 각 상기 제2 변수의 제2 위치 정보를 결정하는 단계; 및
    상기 제1 위치 정보, 각 상기 제2 위치 정보, 상기 제1 중국어 단어 및 각 상기 제2 중국어 단어에 따라, 상기 문장 페어 집합으로부터 상기 번역할 문장과 매칭되는 중국어 문장을 결정하는 단계를 포함하는 정보 출력 방법.
  4. 제2항 또는 제3항에 있어서,
    상기 문장 페어 집합으로부터 상기 번역할 문장과 매칭되는 외국어 문장을 결정하는 단계는,
    상기 번역할 문장을 분할하여, 적어도 2개의 서브 문장을 획득하는 단계; 및
    상기 문장 페어 집합으로부터 상기 적어도 2개의 서브 문장과 매칭되는 외국어 문장을 각각 결정하는 단계를 포함하는 정보 출력 방법.
  5. 제4항에 있어서,
    상기 번역할 문장을 분할하여, 적어도 2개의 서브 문장을 획득하는 단계는,
    상기 제1 변수에 따라, 상기 번역할 문장을 분할하여, 적어도 2개의 서브 문장을 획득하는 단계를 포함하는 정보 출력 방법.
  6. 제2항에 있어서,
    상기 번역할 문장 및 결정된 외국어 문장에 따라, 상기 번역할 문장의 타깃 외국어 문장을 결정하는 단계는,
    상기 제1 변수로 매칭된 외국어 문장 중 제2 변수를 대체하여, 상기 타깃 외국어 문장을 획득하는 단계를 포함하는 정보 출력 방법.
  7. 제1항에 있어서,
    상기 번역할 문장을 획득하는 단계는,
    사용자의 웹 페이지 액세스 요청을 수신한 것에 응답하여, 상기 웹 페이지 액세스 요청 대상 웹 페이지 중 문장을 번역할 문장으로 사용하는 단계를 포함하는 정보 출력 방법.
  8. 제1항에 있어서,
    상기 문장 페어 집합은,
    중국어 문장 집합을 획득하는 단계;
    상기 중국어 문장 집합 내 각 중국어 문장 중 제3 변수 및 제3 중국어 단어를 결정하는 단계;
    각 중국어 문장에 상기 제3 변수를 표기하고, 표기된 각 중국어 문장을 출력하여, 각 중국어 문장 중 제3 중국어 단어를 번역하도록 하는 단계;
    번역된 각 외국어 문장을 수신하는 단계; 및
    각 중국어 문장 및 대응되는 각 외국어 문장을 문장 페어로서 상기 문장 페어 집합에 추가하는 단계에 의해 결정되는 정보 출력 방법.
  9. 정보 출력 장치로서,
    번역할 문장을 획득하도록 구성된 획득 유닛;
    기설정된 문장 페어 집합으로부터 상기 번역할 문장과 매칭되는 외국어 문장을 결정하도록 구성된 매칭 유닛 - 상기 문장 페어 집합은 중국어 문장 및 대응되는 외국어 문장을 포함함 -;
    상기 번역할 문장 및 결정된 외국어 문장에 따라, 상기 번역할 문장의 타깃 외국어 문장을 결정하도록 구성된 결정 유닛; 및
    상기 타깃 외국어 문장을 출력하도록 구성된 출력 유닛을 포함하는 정보 출력 장치.
  10. 제9항에 있어서,
    상기 매칭 유닛은,
    상기 번역할 문장 중 제1 변수 및 제1 중국어 단어를 결정하도록 구성된 제1 결정 모듈;
    상기 문장 페어 집합 내 각 중국어 문장 중 제2 변수 및 제2 중국어 단어를 결정하도록 구성된 제2 결정 모듈;
    상기 제1 변수, 상기 제1 중국어 단어, 각 상기 제1 중국어 단어 및 각 상기 제2 중국어 단어에 따라, 상기 문장 페어 집합으로부터 상기 번역할 문장과 매칭되는 중국어 문장을 결정하도록 구성된 제1 매칭 모듈; 및
    결정된 중국어 문장에 대응되는 외국어 문장을, 상기 번역할 문장과 매칭되는 외국어 문장으로 사용하도록 구성된 제2 매칭 모듈을 포함하는 정보 출력 장치.
  11. 제10항에 있어서,
    상기 제1 매칭 모듈은 또한,
    상기 번역할 문장 중 상기 제1 변수의 제1 위치 정보를 결정하고;
    상기 문장 페어 집합 내 각 중국어 문장 중 각 상기 제2 변수의 제2 위치 정보를 결정하며;
    상기 제1 위치 정보, 각 상기 제2 위치 정보, 상기 제1 중국어 단어 및 각 상기 제2 중국어 단어에 따라, 상기 문장 페어 집합으로부터 상기 번역할 문장과 매칭되는 중국어 문장을 결정하도록 구성되는 정보 출력 장치.
  12. 제10항 또는 제11항에 있어서,
    상기 결정 유닛은,
    상기 번역할 문장을 분할하여, 적어도 2개의 서브 문장을 획득하도록 구성된 문장 분할 모듈; 및
    상기 문장 페어 집합으로부터 상기 적어도 2개의 서브 문장과 매칭되는 외국어 문장을 각각 결정하도록 구성된 제3 결정 모듈을 포함하는 정보 출력 장치.
  13. 제12항에 있어서,
    상기 문장 분할 모듈은 또한,
    상기 제1 변수에 따라, 상기 번역할 문장을 분할하여, 적어도 2개의 서브 문장을 획득하도록 구성되는 정보 출력 장치.
  14. 제10항에 있어서,
    상기 결정 유닛은 또한,
    상기 제1 변수로 매칭된 외국어 문장 중 제2 변수를 대체하여, 상기 타깃 외국어 문장을 획득하도록 구성되는 정보 출력 장치.
  15. 제9항에 있어서,
    상기 획득 유닛은 또한,
    사용자의 웹 페이지 액세스 요청을 수신한 것에 응답하여, 상기 웹 페이지 액세스 요청 대상 웹 페이지 중 문장을 번역할 문장으로 사용하도록 구성되는 정보 출력 장치.
  16. 제9항에 있어서,
    상기 장치는 구축 유닛을 더 포함하고, 상기 구축 유닛은,
    중국어 문장 집합을 획득하고;
    상기 중국어 문장 집합 내 각 중국어 문장 중 제3 변수 및 제3 중국어 단어를 결정하며;
    각 중국어 문장에 상기 제3 변수를 표기하고, 표기된 각 중국어 문장을 출력하여, 각 중국어 문장 중 제3 중국어 단어를 번역하도록 하며;
    번역된 각 외국어 문장을 수신하고;
    각 중국어 문장 및 대응되는 각 외국어 문장을 문장 페어로서 상기 문장 페어 집합에 추가하도록 구성되는 정보 출력 장치.
  17. 정보를 출력하기 위한 전자 기기로서,
    적어도 하나의 프로세서; 및
    상기 적어도 하나의 프로세서와 통신 연결되는 메모리를 포함하되,
    상기 메모리에 상기 적어도 하나의 프로세서에 의해 실행 가능한 명령이 저장되고, 상기 명령이 상기 적어도 하나의 프로세서에 의해 실행되어, 상기 적어도 하나의 프로세서가 제1항 내지 제3항 및 제6항 내지 제8항 중 어느 한 항에 따른 방법을 수행할 수 있도록 하는 전자 기기.
  18. 컴퓨터 명령이 저장된 비일시적 컴퓨터 판독 가능 저장 매체로서,
    상기 컴퓨터 명령은 상기 컴퓨터가 제1항 내지 제3항 및 제6항 내지 제8항 중 어느 한 항에 따른 방법을 수행하도록 하는 비일시적 컴퓨터 판독 가능 저장 매체.
  19. 컴퓨터 판독 가능한 저장 매체에 저장된 컴퓨터 프로그램으로서,
    상기 컴퓨터 프로그램이 프로세서에 의해 실행될 경우 제1항 내지 제3항 및 제6항 내지 제8항 중 어느 한 항에 따른 방법을 구현하도록 하는 컴퓨터 프로그램.
KR1020210045332A 2020-07-15 2021-04-07 정보 출력 방법, 장치, 기기 및 저장 매체 KR102531507B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010678775.X 2020-07-15
CN202010678775.XA CN111931524B (zh) 2020-07-15 2020-07-15 用于输出信息的方法、装置、设备以及存储介质

Publications (2)

Publication Number Publication Date
KR20210045960A true KR20210045960A (ko) 2021-04-27
KR102531507B1 KR102531507B1 (ko) 2023-05-12

Family

ID=73312526

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210045332A KR102531507B1 (ko) 2020-07-15 2021-04-07 정보 출력 방법, 장치, 기기 및 저장 매체

Country Status (5)

Country Link
US (1) US11687735B2 (ko)
EP (1) EP3825897A3 (ko)
JP (1) JP2022017173A (ko)
KR (1) KR102531507B1 (ko)
CN (1) CN111931524B (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113343647B (zh) * 2021-06-29 2024-08-16 北京搜狗科技发展有限公司 一种句对匹配方法、装置和用于匹配句对的装置
CN115983291A (zh) * 2021-10-15 2023-04-18 华为技术有限公司 网页内容翻译方法、计算机设备、存储介质及程序产品

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010152420A (ja) * 2008-12-23 2010-07-08 Fuji Xerox Co Ltd 例文マッチング翻訳装置、およびプログラム、並びに翻訳装置を含んで構成された句翻訳装置
US20120232882A1 (en) * 2009-08-14 2012-09-13 Longbu Zhang Method for patternized record of bilingual sentence-pair and its translation method and translation system
US20120310624A1 (en) * 2007-12-05 2012-12-06 Yishan Wong Community Translation On A Social Network
US20130173247A1 (en) * 2011-12-28 2013-07-04 Bloomberg Finance L.P. System and Method for Interactive Auromatic Translation

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020091509A1 (en) 2001-01-02 2002-07-11 Yacov Zoarez Method and system for translating text
CN100437557C (zh) * 2004-02-04 2008-11-26 北京赛迪翻译技术有限公司 基于语言知识库的机器翻译方法与装置
US9201870B2 (en) * 2008-01-25 2015-12-01 First Data Corporation Method and system for providing translated dynamic web page content
US20180095950A1 (en) * 2016-10-05 2018-04-05 Lingua Next Technologies Pvt. Ltd. Systems and methods for complete translation of a web element
CN109145313A (zh) * 2018-07-18 2019-01-04 广州杰赛科技股份有限公司 语句的翻译方法、装置和存储介质
CN109614082B (zh) * 2018-09-28 2022-03-04 创新先进技术有限公司 一种针对数据查询脚本的翻译方法、装置及设备
CN109858045B (zh) * 2019-02-01 2020-07-10 北京字节跳动网络技术有限公司 机器翻译方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120310624A1 (en) * 2007-12-05 2012-12-06 Yishan Wong Community Translation On A Social Network
JP2010152420A (ja) * 2008-12-23 2010-07-08 Fuji Xerox Co Ltd 例文マッチング翻訳装置、およびプログラム、並びに翻訳装置を含んで構成された句翻訳装置
US20120232882A1 (en) * 2009-08-14 2012-09-13 Longbu Zhang Method for patternized record of bilingual sentence-pair and its translation method and translation system
US20130173247A1 (en) * 2011-12-28 2013-07-04 Bloomberg Finance L.P. System and Method for Interactive Auromatic Translation

Also Published As

Publication number Publication date
KR102531507B1 (ko) 2023-05-12
US20210200964A1 (en) 2021-07-01
CN111931524A (zh) 2020-11-13
EP3825897A2 (en) 2021-05-26
CN111931524B (zh) 2023-08-08
US11687735B2 (en) 2023-06-27
EP3825897A3 (en) 2021-10-06
JP2022017173A (ja) 2022-01-25

Similar Documents

Publication Publication Date Title
US11403468B2 (en) Method and apparatus for generating vector representation of text, and related computer device
JP7301922B2 (ja) 意味検索方法、装置、電子機器、記憶媒体およびコンピュータプログラム
KR102694584B1 (ko) 이벤트 추출 방법, 이벤트 추출 장치 및 전자 기기
EP3832484A2 (en) Semantics processing method, semantics processing apparatus, electronic device, and medium
JP7413630B2 (ja) 要約生成モデルの訓練方法、装置、デバイス及び記憶媒体
CN112328890B (zh) 搜索地理位置点的方法、装置、设备及存储介质
KR20210041546A (ko) 인과 관계의 판별 방법, 장치, 전자 기기 및 저장 매체
US11714840B2 (en) Method and apparatus for information query and storage medium
EP3832492A1 (en) Method and apparatus for recommending voice packet, electronic device, and storage medium
KR102531507B1 (ko) 정보 출력 방법, 장치, 기기 및 저장 매체
US9977766B2 (en) Keyboard input corresponding to multiple languages
JP7395553B2 (ja) 文章翻訳方法、装置、電子機器及び記憶媒体
US20210224480A1 (en) Method, device and storage medium for predicting punctuation in text
CN113139390A (zh) 一种应用于代码字符串的语言转换方法和装置
CN107526742B (zh) 用于处理多语言文本的方法和设备
KR102561951B1 (ko) 모델링 매개 변수의 설정 방법, 장치, 전자 기기 및 기록 매체
JP7223112B2 (ja) ナビゲーション放送の管理方法、装置および装置
US20210216713A1 (en) Method, apparatus, device and storage medium for intelligent response
CN111708800A (zh) 查询方法、装置及电子设备
JP7520085B2 (ja) テキスト誤り訂正とテキスト誤り訂正モデルの生成方法、装置、機器及び媒体
KR20210040318A (ko) 유사도 처리 방법, 장치, 서버, 저장 매체 및 컴퓨터 프로그램
WO2020050894A1 (en) Text to visualization
US11994980B2 (en) Method, device and computer program product for application testing
CN111090991A (zh) 场景纠错方法、装置、电子设备和存储介质
CN110728156B (zh) 翻译方法、装置、电子设备及可读存储介质

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant