KR20030014095A - 전화 음성 통역 서비스 방법 - Google Patents

전화 음성 통역 서비스 방법 Download PDF

Info

Publication number
KR20030014095A
KR20030014095A KR1020020010411A KR20020010411A KR20030014095A KR 20030014095 A KR20030014095 A KR 20030014095A KR 1020020010411 A KR1020020010411 A KR 1020020010411A KR 20020010411 A KR20020010411 A KR 20020010411A KR 20030014095 A KR20030014095 A KR 20030014095A
Authority
KR
South Korea
Prior art keywords
user
service
voice
interpreter
dictionary
Prior art date
Application number
KR1020020010411A
Other languages
English (en)
Inventor
고이즈미아쯔꼬
기따하라요시노리
오부찌야스나리
미즈따니세이끼
Original Assignee
가부시키가이샤 히타치세이사쿠쇼
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 가부시키가이샤 히타치세이사쿠쇼 filed Critical 가부시키가이샤 히타치세이사쿠쇼
Publication of KR20030014095A publication Critical patent/KR20030014095A/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/47Machine-assisted translation, e.g. using translation memory
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99943Generating database or data structure, e.g. via user interface

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Machine Translation (AREA)

Abstract

문례 검색형의 음성 통역 서비스에 있어서, 사용자에게 부담을 주지 않고서 문례집의 커스터마이즈(customize)를 행하여, 사용자가 사용하고자 하는 문례를 고정밀도로 통역할 수 있다.
커스터마이즈용 문례 사전에 기억되는 문례를, 어구의 치환이 가능한 슬롯을 포함하는 문례 템플릿으로서 기술할 수 있도록 한다. 커스터마이즈의 수단으로서는, 사용자 등록된 사용자 프로파일(UP)을 통역 서버 상에 기억하고, 즉, 사용자 등록 화면에, 전화 번호, 이름, 여정, 숙박처, 하고 싶은 것, 사고 싶은 것, 건강 상태 등에 관한 질문을 표시하고, 사용자가 회답을 입력하여 송신하면, 통역 서버 상에 UP가 작성되고, 또한, UP로부터 문례 선택 조건을 추출하고, 커스터마이즈용 문례 사전에 기억된 문례 템플릿 중에서 조건이 일치하는 것을 추출하여 사용자용 문례 사전에 등록하고, 또한, UP로부터 추출한 단어를 문례 템플릿의 슬롯에 삽입하고, 사용자용 문례 사전에 등록하도록 한다.

Description

전화 음성 통역 서비스 방법{METHOD OF INTERPRETATION SERVICE FOR VOICE ON THE PHONE}
본 발명은 사용자가 발성한 음성을 다른 언어로 번역하여 음성으로서 출력하는 자동 통역 서비스에 관한 것으로, 주로 모바일 인터넷 액세스 서비스 이용 가능한 휴대 전화를 이용한 서비스를 대상으로 하지만, 통상의 유선 전화, 퍼스널 컴퓨터, 휴대 정보 단말 등을 이용하여 상기 동작을 행하는 음성 통역 서비스도 포함하는 것이다.
종래의 음성 번역 시스템에는 크게 나누어 2종류의 것이 있다. 하나는 임의의 입력문을 번역하는 시스템이고, 다른 하나는 사전에 준비된 문례를 검색하는 시스템이다.
임의의 입력문을 번역하는 시스템으로서는, 예를 들면, 특개평9-65424에, 음성 인식 서버와 무선 휴대 단말을 이용한 음성 번역 시스템이 개시되어 있다. 임의의 문장을 입력 대상으로 하고 있기 때문에, 원리적으로는 다양한 문장의 번역이 가능하지만, 높은 번역 정밀도가 얻어지기 어렵고, 실제의 운용이 곤란하다라는 문제가 있다.
사전에 준비된 문례를 검색하는 시스템으로서는, 특개소56-88564에, 장면별로 분류된 문례를 화면에 표시하고, 버튼 조작으로 선택된 문장의 번역문의 음성을 출력하는 휴대형 번역 장치가 개시되어 있다.
또한, 특원2000-321921에는, 전화 단말로부터 음성 입력된 정형문을 인식하여 번역문을 음성 출력하는 음성 통역 서비스가 개시되어 있다. 통역 가능한 문장이 사전에 준비된 정형문으로 한정되기 때문에, 통역 정밀도가 매우 높다고 하는 이점이 있지만, 누구에게나 적용 가능한 일반적인 문장밖에 취급할 수 없다고 하는 문제가 있다.
특원2000-321920에는, 예문의 개인 등록이 가능한 음성 통역 서비스가 개시되어 있다. 사용자가 자신이 사용하고자 하는 예문을 등록할 필요가 있기 때문에, 해외 여행 시에 부담없이 통역 서비스를 사용하고자 하는 사용자에게 있어서는 부담이 크다. 또한, 여행에 익숙해진 사람이 아니면 어떠한 문장을 등록하면 좋은지, 좀처럼 생각이 떠오르지 않는다고 하는 문제도 있다.
해외 여행자용 서비스로서 통역 서비스를 생각하였을 때, 문례 검색형의 음성 통역 서비스가 실용적이지만, 음성 인식 정밀도를 높이기 위해서는 입력 대상 문례의 수를 줄일 필요가 있다. 본 발명의 목적은, 사용자에게 부담을 주지 않고서 문례집의 커스터마이즈를 행함으로써, 사용자가 사용하고자 하는 문례를 고정밀도로 통역할 수 있도록 하는 것에 있다.
도 1은 본 발명의 제1 실시예를 나타내는 일영 자동 통역 서비스 시스템의 구성을 나타내는 도면.
도 2는 메모리의 데이터 구조의 예를 나타내는 도면.
도 3은 전화 단말의 예를 나타내는 도면.
도 4는 전화 단말의 디스플레이의 서비스 메뉴 표시예를 나타내는 도면.
도 5는 전화 단말의 디스플레이의 통역 가능한 언어종 표시예를 나타내는 도면.
도 6은 전화 단말의 디스플레이의 통역 가능한 장면 표시예를 나타내는 도면.
도 7은 전화 단말의 디스플레이의 통역 가능한 문례 표시예를 나타내는 도면.
도 8은 전화 단말의 디스플레이의 인식 결과 표시예를 나타내는 도면.
도 9는 언어 변환 테이블의 데이터 구조의 예를 나타내는 도면.
도 10은 전화 단말의 디스플레이의 통역 결과 표시예를 나타내는 도면.
도 11은 과금 테이블의 데이터 구조의 예를 나타내는 도면.
도 12는 언어종 테이블의 데이터 구조의 예를 나타내는 도면.
도 13은 장면 테이블의 데이터 구조의 예를 나타내는 도면.
도 14는 문례 사전의 데이터 구조의 예를 나타내는 도면.
도 15는 문장 사전의 데이터 구조의 예를 나타내는 도면.
도 16은 커맨드 사전의 데이터 구조의 예를 나타내는 도면.
도 17은 전화 단말의 디스플레이의 질문표 표시예를 나타내는 도면.
도 18은 사용자 정보의 데이터 구조의 예를 나타내는 도면.
도 19는 커스터마이즈용 문례 사전의 데이터 구조의 예를 나타내는 도면.
도 20은 단어 사전의 데이터 구조의 예를 나타내는 도면.
도 21은 사용자 단어 사전의 데이터 구조의 예를 나타내는 도면.
도 22는 사용자용 문례 사전의 데이터 구조의 예를 나타내는 도면.
도 23은 사용자용 문장 사전의 데이터 구조의 예를 나타내는 도면.
도 24는 제1 실시예의 동작의 흐름도(예 1)를 나타내는 도면.
도 25는 제1 실시예의 동작의 흐름도(예 2)를 나타내는 도면.
도 26은 제1 실시예의 동작의 흐름도(예 3)를 나타내는 도면.
도 27은 본 발명의 제2 실시예에서의 커스터마이즈를 위한 데이터의 흐름을 나타내는 도면.
도 28은 본 발명의 제2 실시예를 나타내는 일영 자동 통역 서비스 시스템의 구성을 나타내는 도면.
도 29는 전화 단말(1)의 디스플레이(101)로의 레스토랑 카테고리 표시예를나타내는 도면.
도 30은 전화 단말(1)의 디스플레이(101)로의 레스토랑 안내 표시예를 나타내는 도면.
도 31은 전화 단말(1)의 디스플레이(101)로의 레스토랑의 메뉴의 표시예를 나타내는 도면.
<도면의 주요 부분에 대한 부호의 설명>
1 : 전화 단말
2 : 모바일 인터넷 액세스망
3 : 모바일 인터넷 액세스 서비스 게이트웨이 서버
4 : 전화 회선 보드
5 : 커스터마이즈 수단
7 : 음성 인식 수단
10 : 음성 출력 수단
17 : 커스터마이즈용 문례 사전
19 : 사용자용 문장 사전
상기 과제를 해결하기 위해, 본 발명은, 통역 서버가 모바일 인터넷 액세스망으로 접속된 휴대 단말의 화면에 그 통역 서버가 저장하고 있는 통역용 문례집을 표시하고, 휴대 단말로부터 음성 통역 서비스로의 접속 지시를 받았을 때 휴대 단말과의 접속을 전화망 접속으로 전환하여, 휴대 단말에 입력된 사용자 음성을 전화망을 통해 수신하고, 사용자 음성을 인식하여, 인식한 사용자 음성을 다른 언어 표현으로 통역하고, 통역한 다른 언어 표현에 대응하는 음성을 전화망을 통해 휴대 단말로 출력하는 전화 음성 통역 서비스 방법으로서, 통역 서버는 인터넷 액세스망으로 접속된 단말의 화면에 통역 서버에 저장된 사용자 등록용 질문 항목을 표시하고, 단말로부터의 사용자 등록용 질문 항목에 대한 회답에 기초하여 사용자 프로파일을 작성하여 기억하며, 사용자 프로파일에 기초하여 통역용 문례집을 커스터마이즈하여 기억하고, 커스터마이즈한 통역용 문례집을 참조하여 통역 서비스를 행하도록 하고 있다.
또한, 통역 서버는 인터넷 액세스망으로 접속된 해외 여행자를 고객으로 하는 서비스 사업자의 단말의 화면에 통역 서버에 저장된 서비스 내용 질문표를 표시하고, 단말로부터의 서비스 내용 질문표에 대한 회답에 기초하여 서비스 사업자 프로파일을 작성하여 기억하며, 서비스 사업자 프로파일에 기초하여 통역용 문례집을 커스터마이즈하여 기억하고, 서비스 사업자 프로파일에 기초하여 서비스 사업자용 안내 페이지를 작성하여 기억하며, 휴대 단말의 화면에 그 서비스 사업자용 안내 페이지를 표시하고, 표시한 서비스 사업자용 안내 페이지로부터 통역을 요구받았을 때 서비스 사업자 프로파일에 기초한 통역용 문례집을 참조하여 통역 서비스를 행하도록 하고 있다.
또한, 사용자(여행자) 프로파일에 기초하여 커스터마이즈된 통역용 문례집과, 서비스 사업자 프로파일에 기초하여 커스터마이즈된 통역용 문례집의 양 통역용 문례집을 이용하여 통역 서비스를 행하도록 하고 있다.
또한, 서비스 사업자 프로파일에 기초하여 커스터마이즈된 통역용 문례집을 참조한 통역 서비스가 행해진 경우와, 사용자(여행자) 프로파일에 기초하여 커스터마이즈된 통역용 문례집을 참조한 통역 서비스가 행해진 경우에, 휴대 단말과 통역 서버 간의 통신로에 접속된 과금 서버에서의 과금 처리를 변화시키도록 하고 있다.
또한, 과금 서버에서의 과금 처리는, 서비스 사업자 프로파일에 기초하여 커스터마이즈된 통역용 문례집을 참조한 통역 서비스가 행해진 경우에는 과금을 행하지 않도록 하고 있다.
본원 발명의 상기 목적 및 그 외의 목적, 특징 및 장점은 첨부 도면과 결부하여 후술된 바람직한 실시예의 상세한 설명의 관점에서 더욱 명확해질 것이다.
<실시예>
이하, 본 발명의 실시예를 도면을 이용하여 설명한다.
도 1은 본 발명의 제1 실시예를 나타내는 자동 통역 서비스 시스템 구성도이다.
본 발명은 음성 통역기에 관한 것으로, 본 실시예에서의 자동 통역 서버(1000)는 퍼스널 컴퓨터, 워크스테이션 등, 중앙 연산 장치, 메모리를 구비하고, 도 1과 같은 구성을 이룰 수 있는 것이면 어떠한 것이라도 무방하고, 플랫폼의 종류가 본 발명의 적용 범위를 한정하는 것은 아니다. 또, 본 실시예는 영어를 일본어로 통역하는 자동 통역 서비스이지만, 이것은 일례이고, 일영, 중일, 일중 등, 언어의 종류는 한정되지 않는다.
도 1에서, 참조 부호(1)는 모바일 인터넷 액세스 서비스 이용 가능 전화 단말, 참조 부호(2)는 모바일 인터넷 액세스망, 참조 부호(3)는 모바일 인터넷 액세스 서비스 게이트웨이 서버, 참조 부호(4)는 전화 회선 보드, 참조 부호(5)는 커스터마이즈 수단, 참조 부호(6)는 음성 입력 수단, 참조 부호(7)는 음성 인식 수단, 참조 부호(8)는 언어 번역 수단, 참조 부호(9)는 음성 생성 수단, 참조 부호(10)는 음성 출력 수단, 참조 부호(11)는 중앙 연산 장치, 참조 부호(12)는 메모리, 참조부호(13)는 언어종 표시 수단, 참조 부호(14)는 장면 표시 수단, 참조 부호(15)는 문례 표시 수단, 참조 부호(16)는 인식 후보 표시 수단, 참조 부호(17)는 커스터마이즈용 문례 사전, 참조 부호(18)는 단어 사전, 참조 부호(19)는 사용자용 문장 사전, 참조 부호(20)는 문장 사전, 참조 부호(21)는 커맨드 사전, 참조 부호(22)는 언어 변환 테이블, 참조 부호(23)는 어절 세트, 참조 부호(24)는 언어종 테이블, 참조 부호(25)는 장면 테이블, 참조 부호(26)는 사용자용 문례 사전, 참조 부호(27)는 문례 사전, 참조 부호(28)는 사용자 정보, 참조 부호(29)는 사용자 단어 사전, 참조 부호(31)는 인증 서버, 참조 부호(32)는 과금 서버, 참조 부호(33)는 과금 테이블이다.
메모리(12)의 데이터 구조를 도 2에 도시한다. 또한, 모바일 인터넷 액세스 서비스 이용 가능 전화 단말(1)의 개관의 예를 도 3에 도시한다.
또, 여기서는, 모바일 인터넷 액세스 서비스 이용 가능 전화 단말로서, 통화 음성 및 데이터를 동일한 프로토콜에 의해 다룰 수 있는 전화 단말을 가정하여 설명한다.
우선 처음에, 커스터마이즈를 행하지 않은 사용자에 대한 기본적인 통역 서비스의 동작을 설명한다.
도 1, 도 3에서, 우선, 모바일 인터넷 액세스 서비스 이용 가능 전화 단말(1)의 전원(104)을 넣고, 이동 인터넷 접속용 버튼(102)을 누르면 모바일 인터넷 액세스 서비스 패킷망(2)을 통해, 센터의 모바일 인터넷 액세스 서비스 게이트웨이 서버(3)에 접속되고(도 24의 s100), 인증 서버(31)에 의해 모바일 인터넷 액세스 서비스 이용 등록 사용자인 것이 확인된다.
이 시점에서, 사용자 ID가 과금 서버(32)로 송신된다(도 24의 s101). 당연한 일이지만, 사용자 ID는 전화 단말(1)의 ID와 링크되어 있는 경우가 많지만, 전화 단말(1)과는 무관하게 사용자 ID를 패스워드와 조합하여 입력시키는 방법도 있다.
과금 서버(32)는 과금 테이블(33)을 갖는다. 과금 테이블(33)의 데이터 구조를 도 11에 도시한다.
인증 서버(31)로부터 송신된 ID는 과금 테이블(33)의 사용자 ID 컬럼(3311)의 각 셀과 대조되어, 일치된 셀의 요금 컬럼(3312)이 제로 리세트된다(도 24의 s102). 예를 들면 상기 사용자의 사용자 ID가 "1236"이다라고 하면, 과금 테이블(33)의 사용자 ID 컬럼(3311)의 셀 중 "1236"인 셀(3303)과 일치하기 때문에, 요금 컬럼(3312)의 참조 부호(3303)에 대응하는 셀이 "0"으로 된다.
모바일 인터넷 액세스 서비스 게이트웨이 서버(3)에는, 본 실시예의 자동 통역 서버와 같은 각종 서비스 서버가 전용선으로 접속되어 있거나, 일반 인터넷망이 접속되어 있다.
또, 모바일 인터넷 액세스 서비스 게이트웨이 서버(3)로의 접속에는, 상기와 같은 모바일 인터넷 접속용 버튼(102)을 누르는 방법 이외에, 임의의 소정의 전화 번호를 숫자 버튼으로 입력하는 방법 등을 이용해도 된다.
모바일 인터넷 액세스 서비스 이용 가능 전화 단말(1)이 모바일 인터넷 액세스 서비스 게이트웨이 서버(3)에 접속되고, 인증 서버(31)에 의해 모바일 인터넷액세스 서비스 이용 등록 사용자인 것이 확인되면, 모바일 인터넷 액세스 서비스 게이트웨이 서버(3)는 전화 단말(1)의 디스플레이(101)에, 도 4와 같이 서비스의 메뉴를 표시한다(도 24의 s103).
그 서비스 메뉴는, 도 4와 같이, 흑백 반전에 의해 첫번째의 항목의 휘도가 다른 항목과는 상이한 상태로 초기 표시된다.
이것은, 첫번째의 항목이 선택되어 있는 것을 나타내지만, 물론, 그 표시는 흑백 반전에 한하지 않고, 다른 항목과 구별할 수 있는 방법이면 무방하다.
사용자는, 그 서비스 메뉴를 보면서 전화 단말(1) 상의 커서 이동 버튼(105)을 눌러, 흑백 반전을 세번째의 항목 "자동 통역"까지 이동시키고, 다시 전화 단말(1) 상의 확정 기능을 할당한 소정의 버튼(본 실시예에서는 모바일 인터넷 접속용 버튼(102)이 확정 버튼을 겸하는 것으로 함)을 눌러 확정한다(도 24의 s104).
메뉴 항목 "자동 통역"이 확정하면, 전화 단말(1)이 모바일 인터넷 액세스 서비스 게이트웨이 서버(3)를 경유하여 자동 통역 서버(1000)에 접속된다.
다음으로, 자동 통역 서버(1000)의 언어종 표시 수단(13)이 기동되고, 언어종 테이블(24)을 이용하여 전화 단말(1) 상의 디스플레이(101)에, 도 5와 같이 통역 가능한 언어의 종류를 표시한다(도 24의 s105).
언어종 테이블(24)은 도 12와 같은 데이터 구조를 갖고 있고, 언어종 표시 수단(13)은 그 테이블의 언어종(2412)의 각 항목을, 상기 전화 단말(1)로 송신하여 도 5와 같이 그 전화 단말(1) 상의 디스플레이(101)에 표시한다.
도 5에서는, 흑백 반전에 의해 첫번째의 항목의 휘도가 다른 항목과는 상이한 상태로 초기 표시되어 있다. 이것은 첫번째의 항목이 선택되어 있는 것을 나타내지만, 물론, 그 표시는 흑백 반전에 한하지 않고, 다른 항목과 구별할 수 있는 방법이면 무방하다.
사용자는, 그 언어종 메뉴를 보면서 전화 단말(1) 상의 커서 이동 버튼(105)을 눌러, 흑백 반전을 예를 들면 두번째의 항목 "일본어→영어"까지 이동시키고, 다시 전화 단말(1) 상의 확정 버튼(102)을 눌러 확정한다(도 24의 s106).
이 때, 언어종 표시 수단(13)은 전화 단말(1)의 커서 위치를 수취하여 메모리(12) 상의 LANG(209)에 그 위치 번호(언어종 번호)를 저장한다.
예를 들면, 일본어를 영어로 통역하고자 하는 경우에는, 「일본어→영어」가 두번째에 있기 때문에, 메모리(12) 상의 LANG(209)에 "2"가 저장된다.
언어종이 확정되면, 다음으로, 자동 통역 서버(1000)의 장면 표시 수단(14)이 기동되고, 장면 테이블(25)을 이용하여, 전화 단말(1) 상의 디스플레이(101)에 도 6과 같이 통역 가능한 장면을 표시한다.
여기서 말하는 장면이란, 「공항」 「호텔」 「레스토랑」 등, 본 발명의 통역 서비스를 이용하는 장면을 말한다. 장면 테이블(25)은, 도 13과 같은 데이터 구조를 갖고 있고, 장면 표시 수단(14)은 그 테이블의 장면(2512)의 각 항목을, 상기 전화 단말(1)로 송신하여 도 6과 같이 그 전화 단말(1) 상의 디스플레이(101)에 표시한다(도 24의 s107).
도 6에서는, 흑백 반전에 의해 첫번째의 항목의 휘도가 다른 항목과는 상이한 상태에서 초기 표시되어 있다. 이것은 첫번째의 항목이 선택되어 있는 것을 나타내지만, 물론, 그 표시는 흑백 반전에 한하지 않고, 다른 항목과 구별할 수 있는 방법이면 무방하다.
사용자는 해당 장면 메뉴를 보면서 전화 단말(1) 상의 상하 커서 이동의 기능을 할당한 소정의 버튼을 눌러, 흑백 반전을 예를 들면 세번째의 항목 "레스토랑"까지 이동시키고, 다시 전화 단말(1) 상의 상기 소정의 버튼과는 다른 확정 기능을 할당한 소정의 버튼을 눌러 확정한다(도 24의 s108).
이 때, 장면 표시 수단(14)은 전화 단말(1)의 커서의 위치를 수취하여 메모리(12) 상의 SCENE(210)에 그 위치 번호(장면 번호)를 저장한다. 예를 들면, 레스토랑의 장면에서 통역하고자 하는 경우에는, 「레스토랑」이 3행째에 있기 때문에, 메모리(12) 상의 SCENE(210)에 "3"이 저장된다.
장면이 확정되면, 다음으로, 자동 통역 서버(1000)의 문례 표시 수단(15)이 기동되고, 문례 사전(27)을 이용하여 전화 단말(1) 상의 디스플레이(101)에 도 7과 같이 통역 가능한 문례를 표시함(도 25의 s110)과 동시에, 자동 통역 서버(1000)의 음성 입력 수단(6)이 기동된다.
계속해서, 음성 입력 수단(6)은 시스템을 음성 입력 가능한 상태로 한다.
그 후, 사용자는 그 문례를 보면서, 예를 들면 앞의 예에 있어서, 일본어로 레스토랑의 장면에서 통역시키고자 하는 문장을 전화 단말(1)의 송화구의 마이크(106)를 향하여 발성 입력한다(도 25의 s111). 여기서는, 예로서, 레스토랑의 장면에서 「물을 주세요」라는 문장을 영어로 통역하고자 하는 경우를 생각하는 것으로 한다.
문례 사전(27)은 도 14와 같은 데이터 구조를 갖고 있고, 문례 표시 수단(15)은, 문례 사전(27)의 장면 번호(2711)가 메모리(12) 상의 SCENE(210)에 저장되어 있는 값과 일치하는 문례를 순차적으로 상기 전화 단말(1)로 송신하여 그 전화 단말(1) 상의 디스플레이(101)에 표시한다.
앞의 예에서는, 메모리(12) 상의 SCENE(210)에 "3"이 저장되어 있기 때문에, 도 14의 문례 사전(27)의 장면 번호(2711)의 값이 "3"인 항목(2701, 2702, 2703, 2704, 2705)의 문례(2713)의 내용 「안녕하십니까?」 「감사합니다」「[ ]은 어디입니까?」 「[ ]를 주세요」 「[ ]는 있습니까?」를 상기 전화 단말(1)로 송신하여 도 7과 같이 그 전화 단말(1) 상의 디스플레이(101)에 M개씩 순차적으로 표시한다. M은 디스플레이(101)의 크기에 따라 설정하는 상수이지만, 여기서는 M=4로 한다.
사용자는, 상기 문례 중에 「[ ]를 주세요」라는 문례가 있기 때문에, 이 문례를 기초로 「물을 주세요」라고 발성 입력한다. 이 발성 입력 시에, 전화 단말(1) 상에 발성 입력을 신호하는 의미를 갖게 한 소정의 버튼을 눌러 자동 통역 서버(1000)의 음성 입력 수단(6)을 음성 입력 가능한 상태로 하고 나서 발성하도록 해도 되고, 특별히 버튼 등의 트리거를 이용하지 않고서 자동 통역 서버(1000)의 음성 입력 수단(5)이 기동된 후에 언제나 음성 입력 가능한 상태로 해도 된다.
표시하는 문례에는, 슬롯 [ ]을 포함하는 것으로 하지 않는 경우가 있다. 여기서, 슬롯이란 단어, 구 등을 그 개소에 설정할 수 있는 소위 박스이다. 예를 들면, 「[ ]를 주세요」에서는, 슬롯 [ ]에 「물」 「커피」 「찬 물」 등을 설정할 수 있다.
이와 같이, 문례를 표시하여 문형을 어느 정도 규정함으로써, 음성 인식의 정밀도를 현저하게 향상시킬 수 있다. 또한, 문례를 표시함으로써 사용자의 사용 편의성을 향상시킬 수 있다.
이와 같이 문례를 표시하는 경우, 사용자가 원하는 문례를 가능한 한 빠르게 찾을 수 있는 것이 중요하다.
사용자 정보로부터 문례 사전을 커스터마이즈함으로써, 각각의 사용자가 원하는 예문을 빠르게 찾을 수 있다.
또, 상기 표시 문례는 상하 커서 이동의 기능을 할당한 소정의 버튼을 누름으로써, 차례차례로 스크롤하여 인식 가능한 문례를 모두 순차적으로 표시시킬 수 있다.
단, 이 때에, 상기 전화 단말(1) 상의 디스플레이(101)에 표시시키고 있는 최초의 문례의 문례 번호(2712)의 값, 및, 표시시키고 있는 최후의 문례의 문례 번호(2712)의 값을 메모리(12) 상의 BSENTENCE(211), CSENTENCE(212)에 각각 저장한다.
도 7의 예에서는, BSENTENCE(211)에는 "3001", CSENTENCE(212)에는 "3004"가 저장된다.
계속해서, 음성 입력 수단(6)은 전화 회선 보드(4)에서 아날로그/디지털 변환된 입력 음성을 메모리(12) 상의 WAVE(201)에 저장한다(도 25의 s112).
전화 회선 보드(4)에서의 아날로그/디지털 변환의 샘플링 레이트는 8㎑, 11㎑, 16㎑ 등, 사용자가 적절하게 정할 수 있다.
또, 이 시점에서, 상기 사용자가 입력한 음성을 취소하고, 재입력하고자 한다면, 전화 단말(1) 상의 취소 기능을 할당한 소정의 버튼을 누름으로써, 음성 재입력 가능한 상태로 할 수도 있다.
전화 단말(1) 상의 취소 기능을 할당한 소정의 버튼은, 누르면, 발성 입력을 신호하는 의미를 갖게 한 소정의 버튼을 눌렀을 때 혹은 자동 통역 서버(1000)의 음성 입력 수단(6)이 기동된 직후와 동일한 초기 상태로 리세트되어, 음성 입력 가능한 상태로 되도록 한다.
다음으로, 음성 인식 수단(7)이 기동된다.
음성 인식 수단(7)은 메모리(12) 상 WAVE(201)에 저장된 음성 데이터를 판독하여, 특징 벡터의 시계열로 변환하고, 각 문장 음성의 해당 특징 벡터 시계열을 갖는 문장 사전을 이용하여 대조를 행하고, 그 음성 데이터를 인식하여 후보를 출력한다.
특징 벡터 시계열로의 변환 방법이나, 대조 방법을 포함하여 음성을 인식하는 방법으로서는, 예를 들면 L. Rabiner&amp; B. -H. Juang저, 古井貞熙 감역 「음성 인식의 기초(하)」(NTT 어드밴스 테크놀로지, 1995) P245∼P304에 기재된 방법 등을 이용할 수 있다.
물론, 다른 음성 인식 방법을 이용해도 되고, 음성 인식의 방법이 본 발명을 한정하는 것은 아니다.
문장 사전(20)의 데이터 구조를 도 15에 도시한다.
음성 인식 수단(7)은 메모리(12) 상의 WAVE(201)에 저장된 음성 데이터를 판독하여, 문장 사전(20)의 문례 번호(2011)의 값이 메모리(12) 상의 BSENTENCE(211), CSENTENCE(212)에 각각 저장되어 있는 값의 범위 이내인 항목의 것 모두의 특징 벡터 시계열(2014)의 값을 이용하여 음성 인식을 행한다.
앞의 예에서는, BSENTENCE(211)에는 "3001", CSENTENCE(212)에는 "3004"가 저장되어 있기 때문에, 문장 사전(20)의 문례 번호(2011)의 값이 "3001"로부터 "3004"까지의 각 항목의 특징 벡터 시계열(2014)의 값을 이용하여 음성 인식을 행한다.
그 결과, 상기 음성은 공산이 높은 순으로, 예를 들면, 문자열 "메뉴판을 주세요", "물을 주세요", "커피를 주세요", "스푼을 주세요"의 문례 번호 및 문장 번호로 변환된다.
그 때문에, 이들 후보의 문례 번호(2011), 문장 번호(2012), 및 문장(2013)을 공산이 높은 순으로, 메모리(12) 상의 RECOGPNUM(1), RECOGSNUM(1), RECOGS(1), RECOGPNUM(2), REC0GSNUM(2), RECOGS(2), …, RECOGPNUM(N), RECOGSNUM(N), RECOGS(N)(205)에 저장한다.
여기서, N은 문장 사전(20)의 문례 번호(2011)의 값이 메모리(12) 상의 BSENTENCE(211), CSENTENCE(212)에 각각 저장되어 있는 값의 범위 내인 항목의 것의 총수이다.
다음으로, 인식 후보 표시 수단(16)이 기동되어, RECOGS(1), RECOGS(2), …, RECOGS(M)(205)의 내용을, 도 8과 같이, 전화 단말(1)로 송신하여 그 전화 단말(1) 상의 디스플레이(101)에 순차적으로 표시한다(도 25의 s113).
이 때, 메모리(12) 상의 ICNT(204)에 "1"을 저장하고, 전화 단말(1) 상의 디스플레이(101)에 표시되어 있는 RECOGS(ICNT)의 내용이 흑백 반전되도록 한다.
M은 디스플레이(101)의 크기에 따라 설정하는 상수이지만, 여기서는 M=4로 한다.
또한, 메모리(12) 상의 INDEX(215)에 "0"을 저장한다.
사용자는, 제1 후보의 표시가 자신이 발성한 내용과 일치하거나 혹은 가까우면, 그대로 확정 기능을 할당한 소정의 버튼을 눌러 확정한다(도 25의 s114). 제1 후보의 표시가 올바르지 않은 경우, 사용자는 상하 커서 이동의 기능을 할당한 소정의 버튼을 누름으로써, 전화 단말(1) 상의 디스플레이(101) 상의 옳은 문자열이 표시되어 있는 부분까지 흑백 반전 표시 영역을 하방으로 이동시킨다.
즉, 하 이동 버튼을 누를 때마다, 메모리(12) 상의 ICNT(204)의 값을 인크리먼트하고, 전화 단말(1) 상의 디스플레이(101) 상에 메모리(12) 상의 RECOG(ICNT)의 내용이 동일하게 표시되어 있는 부분만을 흑백 반전 표시하도록 한다.
여기서, ICNT(204)의 값이 M을 초과한 경우에는, 메모리(12) 상의 INDEX(215)의 값에 "M"을 가산하고, 다음의 M개의 후보 RECOGS(INDEX+1), RECOGS(INDEX+2), …, RECOGS(INDEX+M)를 메모리(12)로부터 판독하고, 전화 단말(1)로 송신하여 그 전화 단말(1) 상의 디스플레이(101)에 순차적으로 표시한다.
이 때, 메모리(12) 상의 ICNT(204)에 "1"을 저장하고, 전화 단말(1) 상의 디스플레이(101)에 표시되어 있는 RECOGS(INDEX+1), RECOGS(INDEX+2), … ,RECOGS(INDEX+M) 중의 ICNT번째의 표시가 흑백 반전되도록 한다.
이하, 마찬가지로 하여, 다음의 M개의 후보를, 전화 단말(1)로 송신하여 그 전화 단말(1) 상의 디스플레이(101)에 순차적으로 표시한다.
또, 도 15에 도시한 음성 인식에 사용하는 문장 사전(20)의 구조는 일례이고, 예를 들면, 문법과 단어 사전을 조합하는 방법도 있다. 그 경우에도, 메모리(12) 상의 SCENE(210)에 저장된 장면 번호에 대응시켜, 장면별의 문법이나 사전을 이용하도록 한다.
또한, 상 이동 버튼에 의해 흑백 반전 표시 영역을 상방으로 이동시키도록 하고, 백(back)하여 표시 내용을 볼 수 있도록 해도 된다. 즉, 상 이동 버튼을 누를 때마다, 메모리(12) 상의 ICNT(204)의 값을 디크리먼트하고, 전화 단말(1) 상의 디스플레이(101) 상의 RECOGS(INDEX+1), RECOGS(INDEX+2), …, RECOGS(INDEX+M) 중의 ICNT번째의 표시 부분만을 흑백 반전 표시하도록 한다.
사용자가, 흑백 반전되어 있는 표시가 자신이 발성한 내용과 일치하거나 혹은 가깝다고 해서 확정 기능을 할당한 소정의 버튼을 눌러 확정하면, 메모리(12) 상의 RECOGPNUM(INDEX+ICNT), RECOGSNUM(INDEX+ICNT), RECOGS (INDEX+ICNT)의 값을, 동일하게 메모리(12) 상의 PCAND(213), SCAND(214), JAPANESE(203)에 각각 저장한다.
도 8의 예에서는, "물을 주세요"가 제2행째에 표시되어 있기 때문에, 하 이동 버튼을 누름으로써 제2행째까지 흑백 반전 영역을 이동시키고, 확정 버튼을 누른다.
그리고, INDEX는 "0", ICNT는 "2"로 되고, RECOGPNUM(2), RECOGSNUM(2), RECOGS(2)의 값인 "4", "1", "물을 주세요"가 메모리(12) 상의 PCAND(213), SCAND(214), JAPANESE(203)에 각각 저장된다(도 25의 s115).
자신이 발성한 내용의 확인 방법에는, 이상 진술한 바와 같은 전화 단말(1) 상의 디스플레이(101) 상에 음성 인식 후보를 표시하는 방법 외에, 디스플레이(101)를 사용하지 않고서, 이하와 같은 방법을 이용할 수도 있다.
즉, 음성 인식 수단(7)이 공산이 높은 순으로 후보의 문례 번호(2011), 문장 번호(2012), 및 문장(2013)을 공산이 높은 순으로, 메모리(12) 상의 RECOGPNUM(1), RECOGSNUM(1), RECOGS(1), RECOGPNUN(2), RECOGSNUM(2), RECOGS(2), …, RECOGPNUM(N), RECOGSNUM(N), RECOGS(N)(205)에 저장한 후, 음성 생성 수단(9)이 기동되고, 이 때, 메모리(12) 상의 JCNT(208)에 "1"을 저장하고, 메모리(12) 상의 RECOGS(JCNT)를 우선 판독하며, 그 문자열을 합성 음성으로 변환하고, 그 음성의 파형 데이터를 디지털/아날로그 변환에 의해 아날로그 데이터로 변환하여, 음성 출력 수단(10)을 통해 음성으로서 전화 단말(1)로 송신한다.
문자열을 합성 음성으로 변환하기 위해서는, 예를 들면, J. Allen, M. S. Hunnicutt and D. Klatt외 "From Text to Speech"(Cambridge University Press, 1987) P.16으로부터 P.150에 기재되어 있는 포르만트 합성 방식이나, 失頭 「텍스트 음성 합성 기술의 최신 상황」(Interface, Dec., 1996) P.161로부터 P.165에 기재되어 있는 파형 중첩 방식을 사용할 수 있다. 물론, 다른 텍스트 음성 합성 방식을 사용할 수도 있다.
또한, 인식 가능한 문례에 대응하는 음성을 사전에 녹음하여, 메모리 등의 기억 장치에 저장해 두도록 해도 된다.
사용자는, 상기 송신된 음성을 전화 단말(1) 상의 스피커(100)로부터 듣고, 그 음성이 자신이 발성 입력한 내용에 합치되면, 전화 단말(1) 상의 확정 기능을 할당한 소정의 버튼을 눌러 확정한다.
그 음성이 자신이 발성 입력한 내용에 합치되지 않은 경우에는, 사용자는 전화 단말(1) 상의 다음 후보 제시의 기능을 할당한 소정의 버튼을 누르도록 한다.
자동 통역 서버(1000) 중의 음성 생성 수단(9)은, 전화 단말(1) 상의 다음 후보 제시의 기능을 할당한 소정의 버튼을 누르면, 메모리(12) 상의 JCNT(208)를 인크리먼트하고, RECOGS(JCNT)를 판독하며, 그 문자열을 합성 음성으로 변환하고, 그 음성의 파형 데이터를 디지털/아날로그 변환에 의해 아날로그 데이터로 변환하여, 음성 출력 수단(10)을 통해 음성으로서 전화 단말(1)로 송신한다.
상술한 동작과 마찬가지로, 사용자는 상기 송신된 음성을 전화 단말(1) 상의 스피커(100)로부터 듣고, 그 음성이 자신이 발성 입력한 내용에 합치되면, 전화 단말(1) 상의 확정 기능을 할당한 소정의 버튼을 눌러 확정하고, 그 음성이 자신이 발성 입력한 내용에 합치되지 않으면, 사용자는 전화 단말(1) 상의 다음 후보 제시의 기능을 할당한 소정의 버튼을 눌러, 자신이 발성 입력한 내용에 합치되는 음성이 들릴 때까지 이상의 동작을 반복한다.
확정 버튼을 누르면 메모리(12) 상의 RECOGS(ICNT)에 저장되어 있는 문자열을 동일하게 메모리(12) 상의 JAPANESE(203)에 저장한다.
이 확정 버튼을 누르는 대신에, 임의의 소정의 단어 혹은 구 혹은 문장을 사용자가 발성 입력하는 방법을 이용해도 된다.
즉, 사용자는, 상기 송신된 음성을 전화 단말(1) 상의 스피커(100)로부터 듣고, 그 음성이 자신이 발성 입력한 내용에 합치되면, 합치되어 있는 취지의 소정의 단어 혹은 구 혹은 문장을 확정 음성으로서 전화 단말(1) 상의 마이크(106)로부터 발성 입력하고, 그 음성이 자신이 발성 입력한 내용에 합치되지 않으면, 합치되어 있는 경우와는 상이한 소정의 단어 혹은 구 혹은 문장을 비확정 음성으로서 전화 단말(1) 상의 마이크(106)로부터 발성 입력하도록 하고, 자동 통역 서버(1000) 중의 음성 인식 수단(7)이, 상술한 바와 같은 문장 입력과 마찬가지의 방법으로 음성을 인식하고, 모든 공산이 사전에 설정된 임계치를 하회하는 경우 혹은 ICNT(204)의 값이 N을 초과한 경우, 커맨드 사전(21)과의 대조를 개시한다.
커맨드 사전(21)의 데이터 구조를 도 16에 도시한다.
입력 음성의 특징 벡터의 시계열을 커맨드 사전(21)의 각 항목의 특징 벡터의 시계열과 대조하여, 공산이 가장 높은 후보의 커맨드 번호로써 커맨드로 한다.
여기서는 예로서, 사용자가 「까끄떼이(かくてい)」라고 발성 입력한 경우를 상정하면, 우선, 문장 사전(20)을 이용한 인식에서, 그 음성의 특징 벡터와 각 항목의 특징 벡터의 대조에서 공산이 사전에 설정한 임계치를 하회하게 되고, 커맨드 사전(21)의 각 항목의 특징 벡터의 대조가 행해져 참조 부호(2101)의 항목이 인식 후보로 된다.
그 항목의 커맨드 번호가 1이면, 그것은 「확정」을 나타내는 발성 입력으로된다. 확정 음성이면, 메모리(12) 상의 RECOGS(ICNT)에 저장되어 있는 문자열을 동일하게 메모리(12) 상의 JAPANESE(203)에 저장한다.
또한, 비확정 음성이면, 메모리(12) 상의 JCNT(208)를 인크리먼트하고, RECOGS(JCNT)를 판독하며, 그 문자열을 합성 음성으로 변환하고, 그 음성의 파형 데이터를 디지털/아날로그 변환에 의해 아날로그 데이터로 변환하여, 음성 출력 수단(10)을 통해 음성으로서 전화 단말(1)로 송신하는 상술한 동작을 확정 음성으로 될 때까지 반복하도록 한다.
다음으로, 자동 통역 서버(1000) 중의 언어 번역 수단(8)이 기동된다.
언어 번역 수단(8)은, 언어 변환 테이블(22)을 이용하여 메모리 상의 JAPANESE(203)에 저장되어 있는 문자열을 다른 언어로 번역 변환한다.
이하, 언어 번역 수단(8)의 동작에 대하여 설명한다.
언어 변환 테이블(22)의 데이터 구조를 도 9에 도시한다.
우선, 언어 번역 수단(8)은 메모리(12) 상의 PCAND(213), SCAND(2l4)에 저장되어 있는 값을 언어 변환 테이블(22)의 문례 번호(2211) 및 문장 번호(2212)의 각 항목과 순차적으로 대조하여, 일치된 항목의 번역(2213) 중의 LANG(209)의 값의 컬럼의 내용을 메모리(12)의 RESULT(206)에 저장한다(도 25의 s116).
앞의 예에서는, PCAND(213), SCAND(214)에 저장되어 있는 값은 각각 "3004", "3004001"이기 때문에, 참조 부호(2201)의 항목 "물을 주세요"와 일치한다.
또한, LANG(209)의 값은 "2"이기 때문에, 대응하는 번역(2213)의 "I'd like to have a glass of water"를 메모리(12)의 RESULT(206)에 저장한다.
번역 언어로의 변환에 대해서는, 상술한 예와 같은 언어 변환 테이블을 이용하는 방법에만 한하지 않고, 예를 들면 특개평03-328585에 기재되어 있는 용례 데이터 베이스를 이용한 번역 방법이나, 특개평03-51022에 기재되어 있는 구문 해석에 의한 번역 방법 등을 사용해도 된다.
다음으로, 언어 번역 수단(8)은, 도 10에 도시한 바와 같이, 메모리(12)의 JAPANESE(203) 및 RESULT(206)에 각각 저장되어 있는 내용을 전화 단말(1) 상의 디스플레이(101)에 표시한다. 도 10의 표시 방법은 일례이고, 표시의 방법이 본 발명의 범위를 한정하는 것은 아니다.
계속해서, 자동 통역 서버(1000) 중의 음성 생성 수단(9)이 기동된다.
음성 생성 수단(9)은 메모리(12) 상의 RESULT(206)에 저장되어 있는 문자열을 판독하고, 그 문자열을 합성 음성으로 변환하여, 메모리(12) 상의 SYNWAVE(207)에 파형 데이터를 저장한다. 문자열을 합성 음성으로 변환하기 위해서는, 예를 들면, J. Allen, M. S. Hunnicutt and D. Klatt외 "From Text to Speech"(Cambridge University Press, 1987) P.16으로부터 P.150에 기재되어 있는 포르만트 합성 방식이나, 失頭 「텍스트 음성 합성 기술의 최신 상황」(Interface, Dec., 1996) P.161로부터 P.165에 기재되어 있는 파형 중첩 방식을 사용할 수 있다. 물론, 다른 텍스트 음성 합성 방식을 사용할 수도 있다.
또한, 각 영역(英譯)에 대응하는 음성을 사전에 녹음하여, 그대로 혹은 압축하여 메모리 등의 기억 장치에 저장해 두도록 해도 된다.
계속해서, 음성 생성 수단(9)은, 메모리(12) 상의 SYNWAVE(207)에 저장된 통역 음성의 파형 데이터를 아날로그 데이터 혹은 패킷 데이터로 변환하고, 음성 출력 수단(10)을 통해 음성으로서 전화 단말(1)로 송신하여, 그 전화 단말(1)이 갖는 메모리에 상기 송신된 통역 음성을 저장한다(도 25의 s117).
단, 음성 출력 수단(10)으로부터 출력된 통역 음성을 상기 전화 단말(1)이 갖는 메모리에 저장하지 않고, 자동 통역 서버(1000)의 메모리(12) 상에 저장하도록 해도 된다.
이 시점에서, 과금 테이블(33)의 사용자 ID 컬럼(3311)의 상기 인증 서버(31)로부터 송신된 ID 셀에 대응하는 요금 컬럼(3312)의 내용에 통역 1회분의 소정의 요금이 가해진다(도 25의 s118).
예를 들면 통역 일회당 50엔이라는 요금을 설정하고 있으면, 앞의 예에서는, 사용자 ID가 "1236"이므로, 과금 테이블(33)의 사용자 ID 컬럼(3311)의 셀 중 "1236"인 셀(3303)에 대응하는 요금 컬럼(3312)의 셀이 "50"으로 된다. 이 요금은, 1통역 서비스당의 금액으로 설정해도 되고, 임의의 정액 중에서 몇 번이나 통역 서비스를 이용할 수 있도록 설정해도 된다.
서비스 종료 후, 가산된 요금은 각 ID의 사용자에 대하여 청구되어 지불이 행해진다.
요금 중의 수수료 등으로서 소정의 금액이 모바일 인터넷 액세스 서비스 게이트웨이 서버(3)의 소유자에게 지불되고, 남은 금액이 자동 통역 서버(1000)의 소유자에게 지불되도록 한다.
단, 이들 요금의 분배 방법이나 분배처는 일례이고, 상황에 따라 설정할 수있다.
여기서, 사용자가 전화 단말(1) 상의 통역 음성 출력의 기능을 할당한 소정의 버튼을 누르면 그 전화 단말(1) 상의 메모리에 저장되어 있는 통역 음성을 판독하고, 그 전화 단말(1) 상의 스피커(100)로부터 해당 통역 음성이 출력되도록 한다(도 25의 s119).
또한, 사용자가 전화 단말(1) 상의 통역 음성 출력의 기능을 할당한 소정의 버튼을 누르면 그 때마다 그 전화 단말(1) 상의 메모리에 저장되어 있는 통역 음성을 판독하고, 전화 단말(1) 상의 스피커(100)로부터 해당 통역 음성이 출력되도록 한다.
다음으로, 사용자가 사용자 정보를 등록한 경우의 커스터마이즈 처리의 동작을 설명한다.
전화 단말(1) 상의 디스플레이(101)에 도 5의 언어종 선택 화면이 표시되어 있는 상태에서 사용자가 제0번째의 항목 "사용자 정보 등록"을 선택하면, 커스터마이즈 수단(5)이 기동되어, 전화 단말(1) 상의 디스플레이(101)에 도 17과 같이 질문표를 표시한다(도 26의 s120).
사용자 정보(28)에 이미 사용자 정보가 등록되어 있는 경우에는, 질문표에는 현재 등록되어 있는 정보가 표시된다.
사용자는, 전화 단말(1) 상의 커서 이동 버튼(105)을 사용하여 커서를 이동하여, 풀 다운 메뉴로부터 해당하는 회답을 선택한다.
회답란은 풀 다운 메뉴 외에, 복수 항목을 열거한 것 중에서 해당하는 것을라디오 버튼을 클릭함으로써 선택하도록 해도 된다. 「이름」등 몇 개의 정보에 대해서는 숫자 버튼을 사용하여 공란에 문자를 기입한다. 도 17의 예에서는, 이름을 기입하고, 연령, 직업, 체류지, 건강 상태에 대하여 풀 다운 메뉴로부터 선택하여 회답하도록 되어 있다.
또한, 「동행자」를 클릭하면, 동행자에 대하여 마찬가지의 질문이 표시되도록 되어 있다.
전부 입력하고 종료 확정 버튼(102)을 누르면(도 26의 s121), 입력된 정보가 사용자 정보(28)에 기억된다(도 26의 s122).
사용자 정보(28)는 도 18과 같은 데이터 구조를 갖고 있다.
또, 사용자 정보 등록은 인터넷 액세스망을 통해 행하도록 해도 되고, 종이의 포맷으로 기입하게 하여, 통역 서비스 사업자가 컴퓨터에 입력하도록 해도 된다. 패키지 여행 등에서 여행 회사를 통해, 패키지의 일부 혹은 옵션으로서 통역 서비스를 수배하는 경우에는, 패키지의 내용과 신청 용지에 기입된 내용을 기초로 여행 회사가 사용자 정보를 등록하도록 해도 된다.
사용자 정보(28)가 갱신되면, 커스터마이즈 수단(5)은 사용자 정보(28)로부터 문례 선택 조건 및 사용자 단어를 추출하고, 커스터마이즈용 문례 사전(17) 및 단어 사전(18)을 참조함으로써, 사용자 단어 사전(29), 사용자용 문례 사전(26) 및 사용자용 문장 사전(19)을 작성한다.
커스터마이즈용 문례 사전(17)은 도 19에 도시한 데이터 구조를 갖고 있고, 각 문례에 대하여, 장면 번호(1711), 문례 번호(1712), 문례(1713), 슬롯정보(1714), 문례 선택 조건(1715), 번역문 템플릿(1716), 슬롯 문법 정보(1717), 문례 발음 정보(1718)가 기재되어 있다.
단어 사전(18)은 도 20에 도시한 데이터 구조를 갖고 있고, 각 단어에 대하여, 일본어 표제(1811), 판독(1812), 발음 정보(1813), 일본어 문법 정보(1814), 분류 코드(1815), 번역(1816), 번역어 발음 정보(1817), 번역어 문법 정보(1818)가 기재되어 있다.
사용자 단어 사전(29)은 도 21에 도시한 데이터 구조를 갖고 있고, 단어 사전(18)과 마찬가지로, 각 단어에 대하여, 일본어 표제(2911), 판독(2912), 발음 정보(2913), 일본어 문법 정보(2914), 분류 코드(2915), 번역(2916), 번역어 발음 정보(2917), 번역어 문법 정보(2918)가 기재되어 있다.
사용자용 문례 사전(26)은 도 22에 도시한 데이터 구조를 갖고 있고, 각 문례에 대하여, 장면 번호(2611), 문례 번호(2612), 문례(2613), 슬롯 정보(2614)가 기재되어 있다.
사용자용 문장 사전(19)은 도 23에 도시한 데이터 구조를 갖고 있고, 각 문에 대하여, 문례 번호(1911), 문장 번호(1912), 문장(1913), 특징 벡터 시계열(1914)이 기재되어 있다.
커스터마이즈 처리에 있어서, 커스터마이즈 수단(5)은 우선 사용자 정보(28)에 포함되는 단어의 정보를 단어 사전(18)으로부터 추출하여, 사용자 단어 사전(29)을 작성한다.
다음으로, 커스터마이즈용 문례 사전(17)에 등록되어 있는 문례 중에서, 사용자 정보(28)로부터 추출한 문례 선택 조건과 일치하는 것을 선택하여, 사용자 문례 사전(26)에 저장한다(도 26의 s123).
예를 들면, 「건강 상태: 계란 알레르기」라는 사용자 정보로부터 문례 번호 3006번의 「[ ] 알레르기입니다」라는 문례를 선택하여, 사용자 문례 사전(26)에 저장한다.
또한, 사용자 단어 사전(29)에 포함되는 단어와 커스터마이즈용 문례 사전(17)에 등록되어 있는 문례를 사용하여 사용자 발성 인식용의 문장을 생성하고, 사용자용 문장 사전(19)에 저장한다(도 26의 s124).
즉, 사용자 단어 사전(29)에 포함되는 단어의 분류 코드가 문례의 슬롯 정보와 일치할 때, 그 단어를 문례의 슬롯에 삽입하여 새로운 문장을 작성한다.
예를 들면, 사용자가 먹고 싶은 것으로서 사용자 정보에 등록되어 있는 「스톤크랩」을 「[ ]는 있습니까?」라는 문례의 슬롯에 삽입하여, 「스톤크랩은 있습니까?」라는 문장을 작성하고, 사용자용 문장 사전(19)의 문장(1913)에 저장한다. 통역 서비스 회사가 여행지의 지역별로 명물 등의 어휘 리스트를 준비하고, 사용자 정보에 등록되어 있는 행선지(목적지)「마이애미」로부터, 플로리다 명물인「스톤크랩」을 사용자 단어 사전(29)에 등록하도록 해도 된다.
또한, 문례 발음 정보(1718)의 슬롯에 단어 발음 정보(1813)의 정보를 삽입한 것을 특징 벡터의 시계열로 변환하여, 사용자용 문장 사전(19)의 특징 벡터 시계열(1914)에 저장한다.
마지막으로, 작성한 문장이 문장 사전(20)에 포함되어 있는지의 여부를 체크하고, 포함되어 있지 않은 경우에는 번역문을 작성하고, 새로운 문장 번호를 부여하여 언어 변환 테이블(22)에 등록한다. 번역문은 번역문 템플릿(1716)의 슬롯에 역어(1816)를 삽입하여 작성한다.
이 때, 슬롯 문법 정보(1717)에 슬롯에 들어가는 역어의 문법 특징(관사, 단복 등)이 기재되어 있는 경우에는, 사용자 단어 사전의 번역어 문법 정보(1818)를 참조하여 어형 변화시키고 나서 슬롯에 삽입한다.
「[ ]는 있습니까?」의 번역문 템플릿 "Do you have [ ]?"에 대해서는, 「가산 복수; 불가산 단수」라는 슬롯 문법 정보가 기재되어 있다.
따라서, 이 슬롯에 「스톤크랩」의 번역 "stone crab"(가산 명사)를 삽입하는 경우에는, 복수형을 삽입한다.
이에 따라, 「스톤크랩은 있습니까?」의 번역문 "Do you have stone crabs?"이 작성된다.
이상의 처리에 의해, 문례 표시를 위한 사용자용 문례 사전(26), 음성 인식을 위한 사용자용 문장 사전(19), 번역 및 번역문 발성을 위한 언어 변환 테이블(22)이 갱신된다.
본 실시예에서는, 문례 템플릿에 사용자 단어를 대입한 문장과 그 번역문을 사전에 작성하여 음성 인식이나 번역을 행하기 때문에, 사용자 단어 사전(28)은 이상의 커스터마이즈 처리 종료 후에 불필요해져, 소거 가능하다.
통역 서비스를 행할 때, 문례 템플릿과 사용자 단어 사전을 조합하여 음성 인식이나 번역을 행하는 경우에는 사용자 단어 사전(28)을 유지해 둘 필요가 있다.
사용자 정보를 등록하고 있는 사용자에 대해서는, 문례 표시에서는 사용자용 문례 사전(26)의 내용과 문례 사전(27)의 내용을 표시한다.
사용자 문례 사전(26)의 문례를 먼저 표시함으로써, 사용자에게 있어서 중요한 문례를 빠르게 찾을 수 있다.
혹은, 문례 사전(27)에 등록되어 있는 문례 중, 특히 잘 사용되는 문례를 기본 문례로 하고, 기본 문례, 사용자용 문례, 그 밖의 문례의 순으로 표시하도록 해도 된다.
음성 인식에 있어서는 사용자 문장 사전(19)과 문장 사전(20)을 사용한다.
여기서도 사용자 문장 사전을 우선적으로 취급한다.
레스토랑의 장면에서, 「[ ]는 있습니까?」라는 문례의 슬롯에 들어가는 단어는 방대하여, 모든 사용자가 공통으로 사용하는 문장 사전에는 너무 특수한 것을 등록할 수는 없다. 「스톤크랩은 있습니까?」라는 문장을 포함하는 대규모의 사전이 되면, 인식 정밀도가 낮아지게 된다.
여행지나 먹고 싶은 것을 사용자 정보로서 등록하는 것만으로, 사용자에게 있어서 필요한 문장만을 음성 인식의 대상으로 할 수 있다.
이상의 동작의 흐름을 도 24, 도 25, 도 26에 흐름도로 나타낸다.
상기 제1 실시예는, 통역 서비스의 사업자가 개인 사용자를 대상으로 서비스를 제공하는 것이다.
이하에 도시한 제2 실시예는, 여행 회사가 레스토랑, 상점, 관광 시설 등의 위탁을 받아, 여행자에 대하여 관광 정보와 동시에 통역 서비스를 제공하는 것이다.
우선, 도 27에 커스터마이즈를 위한 데이터의 흐름을 나타낸다.
여행 회사 B1은 인터넷 액세스망 B4를 통해, 레스토랑, 상점, 관광 시설 등의 업자에 대하여 등록 안내·앙케이트 B5를 제시한다.
레스토랑 B2가 회답 B6으로서 영업 시간·메뉴·할인 정보 등의 정보를 반송하면, 레스토랑 B2의 프로파일 B10을 작성하고, 레스토랑 안내 데이터 베이스 B16에 레스토랑 B2의 페이지를 추가한다.
레스토랑 안내 데이터 베이스 B16의 정보는 모바일 인터넷 액세스 서비스의 레스토랑 안내 메뉴에 있어서 휴대 단말 사용자에게 제공되는 정보이다.
여행 회사 B1은 인터넷 액세스망 B4를 통해, 여행자에 대하여 여행 안내·앙케이트 B7을 제시한다.
여행자 B3이 회답 B8로서 이름·여정·먹고 싶은 것·사고 싶은 것 등의 정보를 반송하면, 여행자 B3의 프로파일 B9를 작성한다.
다음으로, 여행 회사 B1은 레스토랑 B2의 프로파일 B10과 영일 마스터 사전 B11에 기초하여, 각 레스토랑의 영일 사전 B15를 작성한다.
여기서, 「사전」이란 통역 서비스에서 이용되는 데이터 베이스를 가리키고, 제1 실시예에서의 문례 사전, 문장 사전, 단어 사전에 상당하는 것이다.
영일 마스터 사전 B11에는, 영어 화자가 접객을 위해 말하는 문장을 일본어로 번역하기 위한 것으로, 레스토랑 B2의 영일 사전 B15는 레스토랑 B2의 종업원용으로 어휘나 문례를 커스터마이즈한 것이다. 커스터마이즈의 방법은 제1 실시예에도시한 바와 같다.
또한, 레스토랑 B2의 프로파일 B10으로부터는, 레스토랑 B2의 손님을 위해, 일영 마스터 사전 B12에 기초하여, 레스토랑 B2의 일영 사전 B14를 작성한다.
일영 마스터 사전 B11에는 일본어를 하는 사람이 해외 여행에서 말하는 문장을 영어로 번역하기 위한 것으로, 레스토랑 B2의 일영 사전 B14는 레스토랑 B2의 고객용으로 어휘나 문례를 커스터마이즈한 것이다.
또한, 여행자 B3의 회답 B8과 일영 마스터 사전 B12에 기초하여, 여행자 B3의 일영 사전 B13을 작성한다.
이상에 의해, 커스터마이즈가 완료된다.
이용자가 서비스를 이용할 때의 시스템 구성을 도 28에 도시한다.
도 28에서, 참조 부호(1)는 모바일 인터넷 액세스 서비스 이용 가능 전화 단말, 참조 부호(2)는 모바일 인터넷 액세스망, 참조 부호(3)는 모바일 인터넷 액세스 서비스 게이트웨이 서버, 참조 부호(4)는 전화 회선 보드, 참조 부호(100)는 일영 통역 시스템, 참조 부호(200)는 레스토랑 안내 시스템, 참조 부호(300)는 영일 통역 시스템, B9는 여행자의 프로파일, B10은 레스토랑의 프로파일, B13은 여행자의 일영 사전, B14는 레스토랑의 일영 사전, B15는 레스토랑의 영일 사전, B16은 레스토랑 안내 데이터 베이스, 참조 부호(31)는 인증 서버, 참조 부호(32)는 과금 서버, 참조 부호(33)는 과금 테이블이다.
여행자가 모바일 인터넷 액세스 서비스 이용 가능 전화 단말(1)로부터 모바일 인터넷 액세스 서비스 게이트웨이 서버(3)에 액세스하여, 인증 서버(31)에 의해모바일 인터넷 액세스 서비스 이용 등록 사용자인 것이 확인되면, 모바일 인터넷 액세스 서비스 게이트웨이 서버(3)는 전화 단말(1)의 디스플레이(101)에, 도 4와 같이 서비스의 메뉴를 표시한다.
여행자는 그 서비스 메뉴를 보면서 전화 단말(1) 상의 커서 이동 버튼(105)을 눌러, 흑백 반전을 두번째의 항목 "레스토랑 안내"까지 이동시키고, 다시 전화 단말(1) 상의 확정 기능을 할당한 소정의 버튼(본 실시예에서는 이동 인터넷 접속용 버튼(102)이 확정 버튼을 겸하는 것으로 함)을 눌러 확정한다.
메뉴 항목 "레스토랑 안내"가 확정되면, 전화 단말(1)이 모바일 인터넷 액세스 서비스 게이트웨이 서버(3) 경유로 레스토랑 안내 시스템에 접속되고, 도 29와 같이 레스토랑의 카테고리를 표시한다.
「씨푸드」를 선택하면 씨푸드 레스토랑의 일람이 표시되고, 「레스토랑 AAA」를 선택하면, 도 30과 같이, 「레스토랑 AAA」의 정보가 표시된다. 여기서, 「통역 서비스」를 클릭하면, 일영 통역 시스템이 기동된다.
통역 시스템은 도 6의 장면 선택에서 「레스토랑」을 선택한 후의 상태로부터 시작하고, 도 7과 같은 문례 표시 화면이 표시된다.
이 때, 통역 시스템은 여행자의 일영 사전 B13 외에, 레스토랑 AAA의 일영 사전 B14를 사용한다.
따라서, 여행자의 프로파일에 「먹고 싶은 것」으로서 「스톤크랩」이 기재되어 있는 경우뿐만 아니라, 마침 흥미를 갖고 있던 레스토랑 AAA의 명물 「스톤크랩」을 주문해 보고 싶어서 「스톤크랩은 있습니까?」라고 한 경우라도, 고정밀도로 인식하여 번역할 수 있다.
도 30의 화면에서 「가 보고 싶다」에 체크하면, 여행자의 프로파일 B9에 기억된다. 이에 따라, 다음에 레스토랑 안내에 액세스했을 때에 체크한 레스토랑이 리스트의 상위에 표시된다.
또한, 「레스토랑」의 장면에서는 이 레스토랑의 일영 사전도 참조하도록, 여행자의 일영 사전을 갱신한다.
이에 따라, 실제로 레스토랑에 갔을 때에, 레스토랑 안내를 경유하지 않고서 도 4의 화면에서 통역 서비스에 액세스해도, 그 레스토랑에서 사용하는 문례나 어휘를 고정밀도로 인식하여 번역할 수 있다.
도 30의 화면에서 「메뉴」를 클릭하면 도 31과 같이 레스토랑의 메뉴가 표시된다.
메뉴의 화면에서도 「통역 서비스」를 기동할 수 있기 때문에, 메뉴를 보면서 이야기할 수 있다.
본 제2 실시예에서는, 여행자가 레스토랑 등의 서비스 사업자용의 영일 사전 B14를 사용한 경우, 자신의 영일 사전 B13만을 사용한 경우와는 과금 서버(32)의 동작을 변화시킨다.
보다 구체적으로는, 레스토랑 등의 서비스 사업자용의 영일 사전 B14를 사용한 경우, 과금을 행하지 않거나(무료로 함), 혹은, 과금 테이블에 가산하는 과금량을 자신의 영일 사전 B13만을 사용한 경우의 과금량에 비해 적게 한다.
또, 제1 실시예와 마찬가지의 사용자로의 과금을 행하는 것도 가능하다.
이상과 같이, 제2 실시예에서는, 통역 서비스와 레스토랑 안내 서비스가 관련되어 있기 때문에, 여행자는 레스토랑 안내 서비스에서 소개되어 있는 레스토랑에 가기 쉬워져, 레스토랑의 집객력을 향상시킬 수 있다. 레스토랑 이외에도 상점, 관광지 등에서도 마찬가지의 서비스를 제공하는 것이 가능하다.
당 분야의 업자라면 부가적인 장점 및 변경들이 용이하게 생성될 수 있다. 따라서, 광의의 관점에서의 본 발명은 본 명세서에 예시되고 기술된 상세한 설명 및 대표 실시예들에 한정되는 것은 아니다. 따라서, 첨부된 청구범위들 및 그 등가물들에 의해 정의된 바와 같은 일반적인 발명적 개념의 정신 또는 범위로부터 벗어나지 않고 다양한 변경들이 생성될 수 있다.
본 발명에 따르면, 체크 형식의 간단한 앙케이트에 대답함으로써 문례의 커스터마이즈를 행할 수 있기 때문에, 사용자에게 있어서는 편리하고, 심리적인 부담이 없다고 하는 장점이 있다.
또한, 식사·쇼핑·관광 등의 정보 제공을 받기 위한 앙케이트이기도 하기 때문에, 일석이조의 효과가 있다.
「가 보고 싶다」라고 체크한 장소에 관한 정보를 얻음과 함께 거기에서 사용하는 문례가 사용자 용문장 사전에 등록되는 구조이기 때문에, 여행 준비를 즐기면서, 필요한 문례를 모을 수 있다.
여행 시에도, 임의의 장소에 관한 정보(예를 들면 레스토랑의 위치, 전화 번호, 영업 시간, 메뉴)를 추출하는 것과 거기에서 사용하는 문례를 추출하는 것을연동하여 행할 수 있기 때문에 사용하기 편리하다. 이러한 서비스 제공 형태에서는, 레스토랑, 상점, 관광 시설 등으로부터 운영 자금을 얻음으로써 여행자의 통역 서비스 이용 요금을 무료로 하는 것도 가능해진다.
레스토랑, 상점, 관광 시설 등이 사용자 사전을 갖는 경우에는, 사용자 등록되어 있지 않은 여행자라도 그 장소에 적합한 고정밀도의 통역 서비스를 받을 수 있어, 집객 효과가 있다.

Claims (6)

  1. 통역 서버가, 이동 인터넷 액세스망으로 접속된 휴대 단말의 화면에 상기 통역 서버가 저장하고 있는 통역용 문례집을 표시하고, 상기 휴대 단말로부터 음성 통역 서비스로의 접속 지시를 받았을 때 상기 휴대 단말과의 접속을 전화망 접속으로 전환하여, 휴대 단말에 입력된 사용자 음성을 전화망을 통해 수신하고, 상기 사용자 음성을 인식하여, 상기 인식한 사용자 음성을 다른 언어 표현으로 통역하고, 상기 통역한 다른 언어 표현에 대응하는 음성을 전화망을 통해 상기 휴대 단말로 출력하는 전화 음성 통역 서비스 방법에 있어서,
    상기 통역 서버는, 인터넷 액세스망으로 접속된 단말의 화면에 상기 통역 서버에 저장된 사용자 등록용 질문 항목을 표시하고, 상기 단말로부터의 상기 사용자 등록용 질문 항목에 대한 회답에 기초하여 사용자 프로파일을 작성하여 기억하며, 상기 사용자 프로파일에 기초하여 통역용 문례집을 커스터마이즈하여 기억하고, 상기 커스터마이즈한 통역용 문례집을 참조하여 통역 서비스를 행하는 것을 특징으로 하는 전화 음성 통역 서비스 방법.
  2. 제1항에 있어서,
    상기 통역 서버는, 인터넷 액세스망으로 접속된 해외 여행자를 고객으로 하는 서비스 사업자의 단말의 화면에 상기 통역 서버에 저장된 서비스 내용 질문표를 표시하고, 상기 단말로부터의 상기 서비스 내용 질문표에 대한 회답에 기초하여 서비스 사업자 프로파일을 작성하여 기억하며, 상기 서비스 사업자 프로파일에 기초하여 통역용 문례집을 커스터마이즈하여 기억하고, 상기 서비스 사업자 프로파일에 기초하여 상기 서비스 사업자용 안내 페이지를 작성하여 기억하며, 휴대 단말의 화면에 상기 서비스 사업자용 안내 페이지를 표시하고, 상기 표시한 서비스 사업자용 안내 페이지로부터 통역을 요구받았을 때 상기 서비스 사업자 프로파일에 기초한 통역용 문례집을 참조하여 통역 서비스를 행하는 것을 특징으로 하는 전화 음성 통역 서비스 방법.
  3. 제2항에 있어서,
    상기 사용자(여행자) 프로파일에 기초하여 커스터마이즈된 통역용 문례집과, 상기 서비스 사업자 프로파일에 기초하여 커스터마이즈된 통역용 문례집의 양 통역용 문례집을 이용하여 통역 서비스를 행하는 것을 특징으로 하는 전화 음성 통역 서비스 방법.
  4. 제3항에 있어서,
    상기 서비스 사업자 프로파일에 기초하여 커스터마이즈된 통역용 문례집을 참조한 통역 서비스가 행해진 경우와, 상기 사용자(여행자) 프로파일에 기초하여 커스터마이즈된 통역용 문례집을 참조한 통역 서비스가 행해진 경우에, 상기 휴대 단말과 통역 서버 간의 통신로에 접속된 과금 서버에서의 과금 처리를 변화시키는 것을 특징으로 하는 전화 음성 통역 서비스 방법.
  5. 제4항에 있어서,
    상기 과금 서버에서의 과금 처리는, 상기 서비스 사업자 프로파일에 기초하여 커스터마이즈된 통역용 문례집을 참조한 통역 서비스가 행해진 경우에는 과금을 행하지 않는 것을 특징으로 하는 전화 음성 통역 서비스 방법.
  6. 사용자 등록용 질문 항목을 인터넷 액세스망을 통해 단말로 송신하는 기능과, 상기 단말로부터 송신된 상기 사용자 등록용 질문 항목에 대한 회답을 수신하는 기능과, 수신한 상기 사용자 등록용 질문 항목에 대한 회답에 기초하여 사용자 프로파일을 작성하여 기억하는 기능과, 상기 사용자 프로파일에 기초하여 통역용 문례집을 커스터마이즈하여 기억하는 기능과, 입력된 통역 대상문을 상기 커스터마이즈한 통역용 문례집을 참조하여 통역하는 기능을 컴퓨터에 실현시키기 위한 프로그램.
KR1020020010411A 2001-08-09 2002-02-27 전화 음성 통역 서비스 방법 KR20030014095A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2001241959A JP4495886B2 (ja) 2001-08-09 2001-08-09 音声入力認識文例集の管理方法
JPJP-P-2001-00241959 2001-08-09

Publications (1)

Publication Number Publication Date
KR20030014095A true KR20030014095A (ko) 2003-02-15

Family

ID=19072313

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020020010411A KR20030014095A (ko) 2001-08-09 2002-02-27 전화 음성 통역 서비스 방법

Country Status (3)

Country Link
US (1) US7117223B2 (ko)
JP (1) JP4495886B2 (ko)
KR (1) KR20030014095A (ko)

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003001891A2 (en) * 2001-06-28 2003-01-09 Entelos, Inc. Method and apparatus for computer modeling of an adaptive immune response
JP3974419B2 (ja) * 2002-02-18 2007-09-12 株式会社日立製作所 音声入力を用いた情報取得方法及び情報取得システム
JP4313013B2 (ja) * 2002-09-18 2009-08-12 富士通株式会社 携帯端末装置、その情報処理方法及び、その情報処理プログラム
US20040235458A1 (en) * 2003-05-23 2004-11-25 Walden Charles Lee Automatic activatation of a wireless device
US7360151B1 (en) * 2003-05-27 2008-04-15 Walt Froloff System and method for creating custom specific text and emotive content message response templates for textual communications
US7181538B2 (en) * 2003-11-14 2007-02-20 Sybase 365, Inc. System and method for providing configurable, dynamic multimedia message service pre-transcoding
JP4202287B2 (ja) * 2004-03-15 2008-12-24 公策 大久保 注目する情報について複数のタームを用いて記述されてなる文章テキストからなる情報オブジェクトをコンピュータで可視的に処理するためのシステム及びそのためのコンピュータソフトウエア
US20060253272A1 (en) * 2005-05-06 2006-11-09 International Business Machines Corporation Voice prompts for use in speech-to-speech translation system
US10699593B1 (en) * 2005-06-08 2020-06-30 Pearson Education, Inc. Performance support integration with E-learning system
US20070239625A1 (en) * 2006-04-05 2007-10-11 Language Line Services, Inc. System and method for providing access to language interpretation
US11978436B2 (en) 2022-06-03 2024-05-07 Apple Inc. Application vocabulary integration with a digital assistant
KR100859532B1 (ko) * 2006-11-06 2008-09-24 한국전자통신연구원 대응 문형 패턴 기반 자동통역 방법 및 장치
US20090089042A1 (en) * 2007-01-03 2009-04-02 Samuel Joseph Wald System and method for interpreter selection and connection to communication devices
EP2211689A4 (en) * 2007-10-08 2013-04-17 Univ California Ucla Office Of Intellectual Property VOICE CONTROLLED DASHBOARD WITH CLINICAL INFORMATION
US8041018B2 (en) 2007-12-03 2011-10-18 Samuel Joseph Wald System and method for establishing a conference in two or more different languages
US8239185B2 (en) * 2008-01-17 2012-08-07 Geacom, Inc. Method and system for situational language translation
US8682667B2 (en) * 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US20110313762A1 (en) * 2010-06-20 2011-12-22 International Business Machines Corporation Speech output with confidence indication
US8712761B2 (en) 2011-11-22 2014-04-29 Google Inc. Techniques for performing translation of messages
US9141606B2 (en) 2012-03-29 2015-09-22 Lionbridge Technologies, Inc. Methods and systems for multi-engine machine translation
US9436687B2 (en) * 2012-07-09 2016-09-06 Facebook, Inc. Acquiring structured user data using composer interface having input fields corresponding to acquired structured data
US9262411B2 (en) * 2013-07-10 2016-02-16 International Business Machines Corporation Socially derived translation profiles to enhance translation quality of social content using a machine translation
US9870357B2 (en) * 2013-10-28 2018-01-16 Microsoft Technology Licensing, Llc Techniques for translating text via wearable computing device
US9672263B1 (en) * 2014-06-23 2017-06-06 The United States Of America As Represented By The Secretary Of The Navy Reliability engineering data integration
US10114817B2 (en) 2015-06-01 2018-10-30 Microsoft Technology Licensing, Llc Data mining multilingual and contextual cognates from user profiles
CN106294328A (zh) * 2016-07-26 2017-01-04 四川传意荟能翻译有限公司 一种在线口译智能服务系统及方法
US10191903B2 (en) * 2016-09-30 2019-01-29 Microsoft Technology Licensing, Llc Customized and contextual translated content for travelers
SG11201907351WA (en) * 2017-01-17 2019-09-27 Loveland Co Ltd Multilingual communication system and multilingual communication provision method
CN106952645B (zh) * 2017-03-24 2020-11-17 广东美的制冷设备有限公司 语音指令的识别方法、语音指令的识别装置和空调器
US10762306B2 (en) * 2017-12-27 2020-09-01 Telenav, Inc. Computing system with a cross-locale natural language searching mechanism and method of operation thereof

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5688564A (en) 1979-12-19 1981-07-18 Sharp Corp Electronic translator
JPS5840684A (ja) 1981-09-04 1983-03-09 Hitachi Ltd 自然言語間の自動翻訳方式
US5879163A (en) * 1996-06-24 1999-03-09 Health Hero Network, Inc. On-line health education and feedback system using motivational driver profile coding and automated content fulfillment
JP3716870B2 (ja) 1995-05-31 2005-11-16 ソニー株式会社 音声認識装置および音声認識方法
JP3473204B2 (ja) 1995-08-21 2003-12-02 株式会社日立製作所 翻訳装置及び携帯端末装置
JP3192358B2 (ja) * 1995-10-24 2001-07-23 富士通株式会社 情報センタにおけるサービス可変装置
US6031904A (en) * 1996-10-23 2000-02-29 Nortel Networks Corporation Service order mechanism for telephone subscriber
SE519679C2 (sv) * 1997-03-25 2003-03-25 Telia Ab Metod vid talsyntes
US6944817B1 (en) * 1997-03-31 2005-09-13 Intel Corporation Method and apparatus for local generation of Web pages
US5878423A (en) * 1997-04-21 1999-03-02 Bellsouth Corporation Dynamically processing an index to create an ordered set of questions
US6327346B1 (en) * 1998-09-01 2001-12-04 At&T Corp. Method and apparatus for setting user communication parameters based on voice identification of users
JP3822990B2 (ja) * 1999-01-07 2006-09-20 株式会社日立製作所 翻訳装置、記録媒体
US20020169592A1 (en) * 2001-05-11 2002-11-14 Aityan Sergey Khachatur Open environment for real-time multilingual communication
US6961722B1 (en) * 2001-09-28 2005-11-01 America Online, Inc. Automated electronic dictionary

Also Published As

Publication number Publication date
US20030033312A1 (en) 2003-02-13
US7117223B2 (en) 2006-10-03
JP2003058540A (ja) 2003-02-28
JP4495886B2 (ja) 2010-07-07

Similar Documents

Publication Publication Date Title
KR20030014095A (ko) 전화 음성 통역 서비스 방법
JP4135307B2 (ja) 音声通訳サービス方法および音声通訳サーバ
US6941273B1 (en) Telephony-data application interface apparatus and method for multi-modal access to data applications
KR101577607B1 (ko) 상황 및 의도인지 기반의 언어 표현 장치 및 그 방법
US7283973B1 (en) Multi-modal voice-enabled content access and delivery system
US6377927B1 (en) Voice-optimized database system and method of using same
US7162412B2 (en) Multilingual conversation assist system
US7739118B2 (en) Information transmission system and information transmission method
CN101681365A (zh) 用于分布式语音搜索的方法和装置
JP2004534299A (ja) 位置に基づくサービス
CN1901041B (zh) 语音字典形成方法、语音识别系统及其方法
JPWO2005091166A1 (ja) 機械翻訳システム、機械翻訳方法及びプログラム
WO2017121316A1 (zh) 一种语音转换器
CN106603792B (zh) 一种号码查找设备
CN206639220U (zh) 一种便携式同传设备
CN108846074A (zh) 基于语义理解、知识图谱的智能路牌导向系统
CN101114283A (zh) 旅游机
KR100544905B1 (ko) 여행자를 위한 의사소통 지원 시스템 및 그 서비스 방법
KR20020079121A (ko) 이동통신 단말기를 이용한 정보 검색 시스템과 그시스템을 이용한 정보 검색방법
JP2001075968A (ja) 情報検索方法及びそれを記録した記録媒体
KR101401503B1 (ko) 사용자 음성 기반의 서비스 제공 시스템, 방법 및 장치
KR100480345B1 (ko) 언어코드를 사용한 언어 학습/번역 서비스 시스템 및 그방법
JP2002288170A (ja) 多言語間コミュニケーション支援システム
JP2000010999A (ja) 翻訳通信装置
CN116127101A (zh) 文本检索方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid