CN108140384A - 信息管理系统和信息管理方法 - Google Patents
信息管理系统和信息管理方法 Download PDFInfo
- Publication number
- CN108140384A CN108140384A CN201680060063.3A CN201680060063A CN108140384A CN 108140384 A CN108140384 A CN 108140384A CN 201680060063 A CN201680060063 A CN 201680060063A CN 108140384 A CN108140384 A CN 108140384A
- Authority
- CN
- China
- Prior art keywords
- text
- information
- registration
- voice
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000013459 approach Methods 0.000 title claims description 16
- 238000009826 distribution Methods 0.000 claims abstract description 179
- 238000009434 installation Methods 0.000 claims abstract description 88
- 238000012986 modification Methods 0.000 claims abstract description 76
- 230000004048 modification Effects 0.000 claims abstract description 74
- 238000012545 processing Methods 0.000 claims description 121
- 238000003780 insertion Methods 0.000 claims description 90
- 230000037431 insertion Effects 0.000 claims description 90
- 239000012634 fragment Substances 0.000 claims description 58
- 238000000034 method Methods 0.000 claims description 18
- 230000008859 change Effects 0.000 claims description 8
- 230000005236 sound signal Effects 0.000 description 57
- 238000004891 communication Methods 0.000 description 46
- 238000010276 construction Methods 0.000 description 21
- 238000003860 storage Methods 0.000 description 19
- 238000010586 diagram Methods 0.000 description 16
- 230000005540 biological transmission Effects 0.000 description 12
- 239000000470 constituent Substances 0.000 description 9
- 230000006870 function Effects 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 6
- 230000008901 benefit Effects 0.000 description 6
- 238000009223 counseling Methods 0.000 description 6
- 238000004519 manufacturing process Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 230000009471 action Effects 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 238000007689 inspection Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 235000013399 edible fruits Nutrition 0.000 description 2
- 206010011878 Deafness Diseases 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B61—RAILWAYS
- B61L—GUIDING RAILWAY TRAFFIC; ENSURING THE SAFETY OF RAILWAY TRAFFIC
- B61L15/00—Indicators provided on the vehicle or train for signalling purposes
- B61L15/0018—Communication with or on the vehicle or train
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B61—RAILWAYS
- B61L—GUIDING RAILWAY TRAFFIC; ENSURING THE SAFETY OF RAILWAY TRAFFIC
- B61L15/00—Indicators provided on the vehicle or train for signalling purposes
- B61L15/0072—On-board train data handling
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B61—RAILWAYS
- B61L—GUIDING RAILWAY TRAFFIC; ENSURING THE SAFETY OF RAILWAY TRAFFIC
- B61L15/00—Indicators provided on the vehicle or train for signalling purposes
- B61L15/009—On-board display devices
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09B—EDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
- G09B21/00—Teaching, or communicating with, the blind, deaf or mute
- G09B21/009—Teaching or communicating with deaf persons
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/018—Audio watermarking, i.e. embedding inaudible data in the audio signal
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/06—Transformation of speech into a non-audible representation, e.g. speech visualisation or speech processing for tactile aids
- G10L2021/065—Aids for the handicapped in understanding
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Mechanical Engineering (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Business, Economics & Management (AREA)
- Educational Administration (AREA)
- Educational Technology (AREA)
- Telephonic Communication Services (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
提供了一种信息管理系统,其产生这样的分发信息,所述分发信息用于向终端装置指示有关音频指导的相关信息,所述终端装置向用户呈现所述相关信息,其中所述信息管理系统包括:字符串识别单元,其用于从相互不同的多个登记字符串当中识别出与表示所述音频指导的输入字符串相似的登记字符串;以及信息产生单元,其产生这样的分发信息:该分发信息向所述终端装置指示与由所述字符串识别单元识别出的登记字符串部分地不同的修改字符串所对应的相关信息。
Description
技术领域
本发明涉及一种用于管理为用户提供的信息的技术。
背景技术
传统上,已经提出了一种用于根据说出的语音的言语辨识结果为用户提供各种信息的技术。例如,在专利文献1中公开了一种构造,其中对用户说出的语音执行言语辨识,并且详述了在作为言语辨识的结果而识别的目标位置周围显示的地图的区域或标尺等。
相关技术文献
专利文献
专利文献1:JP-A-03-175478
发明内容
本发明要解决的问题
对于听取指导语音有困难的听觉障碍者或者对于不理解指导语音的语言的外国人来说,如果可以对诸如列车或公交车之类的公共交通服务上广播的指导语音广播执行言语辨识从而使得可以将文本形式或翻译文本形式的指导信息提供给乘客的终端装置,将会很方便。然而在现实中难以实现完美的言语辨识。由于例如个体说话人独有的发音特质(习惯),或者是由于接收语音期间的背景噪声等,可能出现辨识错误。当出现辨识错误时,存在无法向用户提供与指导语音相对应的适当相关信息的可能性。前文中尽管提及了指导语音的言语辨识,但是,例如在担任指导的人员输入由指导语音表示的文本的情况下,也可能出现类似问题。例如,在呈现由指导人员录入的文本或其翻译文本作为相关信息的情况下,存在由于指导人员的输入错误或其他原因而导致无法向用户提供对应于指导语音的适当相关信息的可能性。有鉴于此,本发明的一个目的是向用户提供对应于指导语音的适当相关信息。
解决问题的手段
为解决上述问题,根据本发明一个优选方面的信息管理系统是用于产生这样的分发信息的信息管理系统,所述分发信息用于向终端装置指示有关指导语音的相关信息以通过所述终端装置向用户呈现所述相关信息,并且该系统包括:文本识别器,其构造为从不同的多个登记文本当中识别出与表示所述指导语音的输入文本相似的登记文本;以及信息产生器,其构造为产生这样的分发信息:该分发信息向所述终端装置指示与由所述文本识别器识别出的登记文本部分地不同的修改文本所对应的相关信息。根据本发明另一方面的信息管理系统是用于产生这样的分发信息的信息管理系统,所述分发信息用于向终端装置指示有关指导语音的相关信息以通过所述终端装置向用户呈现所述相关信息,并且所述系统包括:文本识别器,其构造为从不同的多个登记文本当中识别出与表示所述指导语音的输入文本相似的登记文本;以及信息产生器,其构造为产生这样的分发信息:该分发信息向所述终端装置指示由所述文本识别器识别出的登记文本,所述多个登记文本中的每一个包括用于插入多个插入词中的选中的一个的插入片段,其中所述文本识别器构造为执行从所述多个登记文本当中识别出与所述输入文本相似的登记文本的第一处理、以及在所述多个插入词当中搜索与该输入文本对应的插入词的第二处理,并且所述信息产生器构造为:在所述第二处理处识别出与所述输入文本对应的插入词的情况下,产生这样的分发信息:其指示与通过将在所述第二处理处识别出的插入词插入在所述第一处理处识别出的登记文本的插入片段中而得到的文本对应的相关信息,而在所述第二处理处未识别出与所述输入文本对应的插入词的情况下,产生这样的分发信息:其指示与去除了所述插入片段的登记文本相对应的文本所对应的相关信息。根据本发明另一方面的信息管理系统是这样的信息管理系统,其用于产生有关指导语音的相关信息,并且包括:文本识别器,其构造为从不同的多个登记文本当中识别出与表示所述指导语音的输入文本相似的登记文本;以及信息产生器,其构造为产生与由所述文本识别器识别出的登记文本部分地不同的修改文本所对应的相关信息。
为了解决上述问题,根据本发明一个优选方面的信息管理方法是用于产生这样的分发信息的信息管理方法,所述分发信息用于向终端装置指示有关指导语音的相关信息以通过所述终端装置向用户呈现所述相关信息,并且所述方法包括:从不同的多个登记文本当中识别出与表示所述指导语音的输入文本相似的登记文本;以及产生这样的分发信息:其向所述终端装置指示与由文本识别器所识别出的登记文本部分地不同的修改文本所对应的相关信息。根据本发明另一方面的信息管理方法是产生这样的分发信息的信息管理方法,所述分发信息用于向终端装置指示有关指导语音的相关信息以通过所述终端装置向用户呈现所述相关信息,并且所述方法包括:从不同的多个登记文本当中识别出与表示所述指导语音的输入文本相似的登记文本;以及产生向所述终端装置指示由文本识别器识别出的登记文本的分发信息,所述多个登记文本中的每一个包括用于插入多个插入词中的选中的一个的插入片段。识别登记文本包括:执行从所述多个登记文本当中识别出与所述输入文本相似的登记文本的第一处理、以及在所述多个插入词当中搜索与该输入文本对应的插入词的第二处理,并且产生所述分发信息包括:在所述第二处理处识别出与所述输入文本对应的插入词的情况下,产生这样的分发信息:其指示与通过将在所述第二处理处识别出的插入词插入在所述第一处理处识别出的登记文本的插入片段中而得到的文本对应的相关信息,而在所述第二处理处未识别出与所述输入文本对应的插入词的情况下,产生这样的分发信息:其指示与去除了所述插入片段的登记文本对应的文本所对应的相关信息。根据本发明另一方面的信息管理方法是用于产生有关指导语音的相关信息的信息管理方法,所述方法包括:从不同的多个登记文本当中识别出与表示所述指导语音的输入文本相似的登记文本;以及产生与识别出的登记文本部分地不同的修改文本所对应的相关信息。
附图说明
图1是根据本发明第一实施例的信息管理系统的框图;
图2是语音指导系统和管理设备的框图;
图3是指导表格的示意图;
图4是文本识别器和信息产生器的操作的流程图;
图5是终端装置的框图;
图6是信息管理系统的总体操作的流程图;
图7是第二实施例中的指导表格的示意图;
图8是第二实施例中的文本识别器和信息产生器的操作的流程图;
图9是第三实施例中的指导表格的示意图;以及
图10是第三实施例中的文本识别器和信息产生器的操作的流程图。
具体实施方式
第一实施例
图1是第一实施例的信息管理系统100的框图。第一实施例的信息管理系统100是用于向诸如列车或公交车之类的交通设施的用户UA提供信息的计算机系统,并且包括语音指导系统10和管理设备20。语音指导系统10设置在诸如列车或公交车之类的车辆200中,并经由包括互联网等的通信网络300与管理设备20通信。管理设备20例如是连接到通信网络300的服务器(例如,网页服务器)。携带终端装置30的用户UA搭乘车辆200。终端装置30是便携式通信终端,例如,手持移动电话或智能手机。实际上,车辆200中的许多用户UA可以利用信息管理设备20的服务,但在以下说明中为了便于描述,关注单个终端装置30。
管理车辆200的指导人员UB(比如司机或列车员)是在适当时间提供关于交通设施的指导的语音源G(下文将简称为“指导语音”)。通过指导语音G,可以提供关于与交通设施的运行有关的各种信息的语音,例如,下一站(火车站或公交车站)名称或换乘其他线路的通知语音;关于位于下一站附近的设施(例如旅游信息)的通知语音;关于交通设施的运行状态(例如出现停止信号、延迟等)的通知语音;乘车期间的注意事项或者上车或下车时的注意事项的通知语音;以及出现紧急情况的通知语音。
第一实施例的信息管理系统100根据由指导人员UB所说的指导语音G来产生分发信息Q,并将该信息发送到终端装置30。分发信息Q是终端装置30向用户UA呈现与指导语音G有关的信息(下文称为“相关信息”)所需的信息。第一实施例的终端装置30将表达指导语音G的所说内容的文本作为相关信息呈现给用户UA。因此,例如,听取指导语音G有困难的听觉障碍者可以理解指导语音G的内容。
图2是语音指导系统10和管理设备20的框图。如图2所示,第一实施例的语音指导系统10包括分发终端12、声音接收装置14、音频装置16和声音输出装置18。声音接收装置14是用于接收环境声音的音频设备(麦克风)。具体地,声音接收装置14接收由指导人员UB所说的指导语音G,并产生表示指导语音G的波形的音频信号SG。出于描述的目的,图中省略了用于将声音接收装置14产生的模拟音频信号SG转换为数字格式的A/D转换器的图示。第一实施例的指导人员UB说出预先准备的多个文本(下文称为“登记文本”)中的任一个作为指导语音G。例如,参考记录了多个登记本文的通知簿,指导人员UB选择适合于交通设施的实际运行状态的登记文本,并说出它以作为指导语音G。换言之,本质上指导语音G的内容是预先准备的,并且不由指导人员UB自由决定。
由声音接收装置14产生的音频信号SG经由音频装置16作为音频信号SA供给到声音输出装置18。音频装置16执行针对音频信号SG执行诸如放大处理和调节处理(例如,频率特性的调节)之类的音频处理,从而产生音频信号SA。声音输出装置18是用于输出与音频装置16供给的音频信号SA相对应的声音的音频设备(扬声器)。具体地,由音频信号SG表示的指导语音G从声音输出装置18输出,以用于传输给用户UA。出于描述的目的,图中省略了用于将数字音频信号SA转换为模拟格式的D/A转换器的图示。从以上描述将会理解,第一实施例的语音指导系统10是其中将分发终端12与现有车载通知系统相连接以用于在音频装置16进行处理之后从声音输出装置18输出指导语音G的音频系统;待处理的指导语音G由声音接收装置14接收。值得注意的是,语音指导系统10的构造是自由选择的;例如,可以在单个设备中设置分发终端12、声音接收装置14、音频装置16和声音输出装置18的各元件。
由声音接收装置14产生的音频信号SG从声音接收装置14与音频装置16之间的路径分岔,并且供给到分发终端12。具体地,音频信号SG经由有线或无线路径供给到分发终端12。分发终端12是用于为终端装置30提供与由来自声音接收装置14供给的音频信号SG表示的指导语音G相对应的分发信息Q的信息装置。分发终端12由例如移动电话、智能手机、平板终端等便携式终端装置实现。第一实施例的分发终端12包括控制装置122和通信装置124,如图2所示。通信装置124经由通信网络300与管理设备20通信。第一实施例的通信装置124是与通信网络300无线通信的无线通信装置。
控制装置122是用于控制分发终端12的总体操作的处理装置(例如,CPU(中央处理单元))。可以通过由控制装置122执行程序来实现用于获取和分发与指导语音G对应的分发信息Q的多个功能(语音获取器52和信号处理器54),该程序被存储在已知的记录介质(未示出)中,比如磁记录介质或半导体记录介质。
语音获取器52从声音接收装置14获取由指导语音G表示的语音信号SG。由语音获取器52获取的音频信号SG从通信装置124经由通信网络300发送到管理设备20。管理设备20接收从语音指导系统10发送的音频信号SG,并产生分发信息Q,其用于指令终端装置30呈现与由音频信号SG表示的指导语音G有关的相关信息。由管理设备20产生的分发信息Q从管理设备20发送到语音指导系统10。通信装置124从通信网络300接收由管理设备20发送的分发信息Q。
信号处理器54产生音频信号SQ作为声音成分,其包含了在通信装置124处接收到的来自管理设备20的分发信息Q。信号处理器54为了产生音频信号SQ,可以自由采用已知技术。例如,可以是这样的构造:其中使用分发信息Q对诸如具有预定频率的正弦波之类的载波进行频率调制,从而产生音频信号SQ;或者优选地为这样的构造:使用扩频码执行分发信息Q的扩频调制并使用预定频率的载波执行频率转换,从而产生音频信号SQ。音频信号SQ的频带是在其中可以由声音输出装置18进行声音输出和由音频装置16进行声音接收的频带。音频信号SQ的频带落入比在普通环境下对用户可听的声音(诸如语音(例如,指导语音G)、音乐等)的声音频带高的频带范围(例如,从18kHz至20kHz)之内。然而,音频信号SQ的频带可以自由设定:例如,可以产生在可听频带之内的音频信号SQ。
由信号处理器54产生的音频信号SQ在被音频装置16处理之后作为音频信号SA被供给声音输出装置18。换句话说,包括与分发信息Q对应的声音成分(音频信号SQ)的音频信号SA被供给声音输出装置18,并且与分发信息Q对应的声音成分从声音输出装置18输出为声音。音频装置16可以将音频信号SG和音频信号SQ组合以产生音频信号SA。
从上面的描述将会理解,第一实施例的声音输出装置18用作用于经由使用作为充当传输介质的空气振动的声音(声波)的声音通信来将分发信息Q发送到终端装置30的手段(发送器)。换句话说,声音输出装置18输出由声音接收装置14接收的指导语音G,并进一步通过输出包括分发信息Q的声音来将分发信息Q发送到终端装置30。在上述构造中,输出指导语音G的声音输出装置18还用于发送分发信息Q,结果,上述构造的优点在于,与其中与声音输出装置18不同的另一装置将分发信息Q发送到终端装置30的构造相比,语音指导系统10的构造可以得到简化。
图2所示的管理设备20是用于管理应被提供给终端装置30的分发信息Q的设备,并管理设备20包括控制装置22、存储装置24、和通信装置26。管理设备20可以构成为单个设备或者构成为彼此独立地构造的多个装置(即,计算机系统)。例如,存储装置24可以设置为与管理设备20独立的云存储,并且控制装置22可以经由例如通信网络300对存储装置24进行读取和/或写入。换句话说,可以从管理设备20省略存储装置24。
控制装置22是控制管理设备20的总体操作的处理装置(例如CPU)。通信装置26经由通信网络300与分发终端12通信。例如,通信装置26接收从分发终端12发送的音频信号SG,并将对应于音频信号SG的分发信息Q发送到分发终端12。存储装置24存储由控制装置22执行的程序和由控制装置22使用的各种数据。可以自由采用诸如磁记录介质或半导体记录介质之类的已知记录介质或者多种类型的记录介质的组合来作为存储装置24。第一实施例的存储装置24存储指导表格TA。
图3是指导表格TA的示意图。如图3所示,在指导表格TA中,登记有预期由指导人员UB说出的多个登记文本X(X1、X2、...)以及针对每个登记文本X的识别信息DX(DX1、DX2、...)。如图3所示,第一实施例的每个登记文本X包含单个插入片段B。在图3中,插入片段B由方括号[]表示。在插入片段B中,选择性地插入多个文本(下文称为“插入词”)Y中的任一个。换句话说,登记文本X通常为多种类型的指导共有的文本(通常为句子),其中使得插入词Y不同,并且每个插入词Y是要针对每个指导来选择并插入到登记本文X的插入片段B中的文本(例如,字)。如图3所示,对于多个登记本文X的每一个,作为要被插入登记本文X中的插入片段B中的候选的多个插入词Y(Y11、Y12、...)与每个插入词Y的识别信息DY(DY11、DY12、...)一起被登记在指导表格TA中。例如,如图3所示,对于用于向用户UA告知列车的异常停车的登记文本X1“由于[],我们已停车。非常抱歉引起延误。请等待恢复”,登记了诸如“车辆检查”、“信号故障”和“有人员进入铁轨”之类的多个插入词Y(Y11、Y12、Y13、...)以用于表示异常停车的原因。对于用于告知下一站的登记文本X2,“我们将很快在[]站停车。左侧车门将开启”,登记了诸如“东京”、“秋叶原”、“上野”之类的多个插入词Y(Y21、Y22、Y23、...)以用作要被插入登记文本X2中的插入片段B中站名的候选。可插入到插入片段B中的插入词Y的内容和/或总数可以根据登记文本X而不同。
如图3所示,指导表格TA包含与不同登记文本X对应的多个文本D(以下称为“修改文本”D)的识别信息DZ(DZ1、DZ2、...)。识别信息DZ是用于唯一地识别修改文本Z的符号。与登记文本X中的任一个相对应的修改文本Z是在内容上与登记文本X相似或共通、但在表达上与登记本文X部分地不同的文本。具体地,如图3所示,对于用于向用户UA告知列车的异常停车的登记文本X1“由于[],我们已停车。非常抱歉引起延误。请等待恢复”,登记了修改文本Z1,其读作“我们已停车。非常抱歉引起延误。请等待恢复”,其中从登记文本X1删除了包括插入片段B的“由于[]”。对于登记文本X2,“我们将很快在[]站停车。左侧车门将开启”,登记了修改文本Z2,其读作“我们将很快停车。左侧车门将开启”,其中从登记文本X2删除了包括站名的插入片段B的“在[]站”。
图3示出单个指导表格TA的示例,其中登记文本X与多个插入词Y和修改文本Z相关联,但用于定义登记文本X、多个插入词Y和修改文本Z之间的关系的数据格式不固定。例如,可以使用多个表格来定义登记文本X、多个插入词Y和修改文本Z之间的关系。具体地,除了表示登记文本X与插入词Y之间的关系的表格之外,还可以准备表示登记文本X与修改文本Z之间的关系的表格。在图3中,出于描述目的与识别信息DZ一同示出修改文本Z,但如果利用指导表格TA登记了识别信息DZ,则不必登记修改文本Z本身。
图2中的控制装置22执行存储在存储装置24中的程序,从而实现用于产生与指导语音G的音频信号SG对应的分发信息Q的多个功能(语音分析器62、文本识别器64、和信息产生器66)。应当注意,通过专用电子电路来实现控制装置22的部分功能的构造或者通过多个装置协作地实现控制装置22的功能的构造。
语音分析器62通过使用对由通信装置26从分发终端12接收到的音频信号SG执行的言语辨识来识别表示指导语音G的言语内容的文本(下文称为“输入文本”)L。换句话说,输入文本L是由指导人员UB所说的文本。为了执行言语辨识以表示指导语音G,可以自由采用已知技术,例如利用诸如HMM(隐马尔可夫模型)之类的音频模型以及指示语言约束的语言模型的辨识处理。
如上所述,指导人员UB基本上说出登记在预先准备的通知簿等中的文本X中的一个。因此,理想的是,借助于言语分析器62通过指导语音G的言语辨识而被识别的输入文本L与登记在指导表格TA中的登记文本X中的任一个匹配。但实际上在语音分析器62的言语辨识中可能会由于每个个体指导人员UB独有的发音特质(习惯)、声音接收装置14周围的背景噪声等而出现辨识错误。因此,输入文本L和登记文本X可以彼此相似,但彼此部分不同。
有鉴于此,第一实施例的文本识别器64在多个不同登记文本X当中识别出与语音分析器62识别的输入文本L相似的登记文本X。具体地,文本识别器64在指导表格TA中登记的多个登记文本X当中识别出与言语分析器62识别的输入文本L相似的登记文本X,并在与该登记文本X对应的多个插入词Y当中识别出与输入文本L对应的插入词Y。
图4是第一实施例的文本识别器64和信息产生器66的操作的流程图。图4的处理在每当语音分析器62识别出输入文本L时开始。
如图4所示,第一实施例的文本识别器64顺序地执行第一处理S51和第二处理S52(S5)。第一处理S51是从指导表格TA中登记的多个登记文本X当中识别出与输入文本L相似的登记文本X的处理。具体地,文本识别器64针对指导表格TA中的多个登记文本X中的每一个,计算与输入文本L的相似度指标(下文称为“相似度指标”),并从多个登记文本X当中识别出具有由相似度指标所指示的最大相似度的登记文本X(即,与输入文本L最相似的登记文本X)。尽管相似度指标的类型是自由选择的,但可以自由地采用比如用于评估多个文本之间的相似度的编辑距离(莱文斯坦距离)之类的已知指标作为相似度指标。自由地选择识别与输入文本L相似的登记文本X的方法。例如,可以采用识别包括特定文本(例如,属于特定字类或词类的字或词)的登记文本X的处理作为第一处理S51,所述特定文本包括在输入文本L中。替代地,使用从大量文本提取的特征量的机器学习而预先产生的辨识模型来识别与输入文本L相似的登记文本X的处理也可以优选地作为第一处理S51。
图4所示的第二处理S52是在与第一处理S51所识别的登记文本X对应的多个插入词Y当中搜索与输入文本L对应的插入词Y的处理。具体地,文本识别器64将与登记文本X对应的多个插入词Y中的每一个顺序地与输入文本L比较,以识别在输入文本L中包括的插入词Y。自由地选择识别与输入文本L对应的插入词Y的方法。例如,可以采用在整个输入文本L当中搜索插入词Y的处理、以及将与输入文本L当中的登记文本X的插入片段B对应的部分与每个插入词Y比较,从而在该部分与每个插入词Y之间进行区分的处理,来作为第二处理S52。另外,计算多个插入词Y中的每一个与输入文本L的上述相似度指标,并根据每个插入词Y的相似度指标来识别输入文本L中的插入词Y的处理也可以优选地作为第二处理S52。然而,由于基本上将不会有太多类型的针对指导语音G的插入词Y,因此将每个插入词Y顺序地与输入文本L比较的上述处理可以实际地识别适当的插入词Y。
图2中的信息产生器66根据语音分析器62和文本识别器64的处理结果来产生用于向终端装置30指示相关信息的分发信息Q(S6)。如上所述,在第一处理S51处借助于文本识别器64来识别与输入文本L相似的登记文本X,而在第二处理S52处搜索多个插入词Y当中与输入文本L对应的插入词Y(典型地为输入文本L中包含的插入词Y)。如果指导人员UB的指导语音G的发音和语音分析器62的言语辨识是正确的,则可以恰当地指定与输入文本L对应的登记文本X和插入词Y两者。然而,如果指导人员UB发音错误(例如,如果指导人员UB说出了除记录在通知簿中的规定词以外的词)或语音分析器62辨识错误,则存在不能从与在第一处理S51处识别的登记文本X对应的多个插入词Y当中识别与输入文本L对应的插入词Y的可能性。
如图4所示,第一实施例的信息产生器66在S61处,决定文本识别器64在第二处理S52处是否识别出与输入文本L对应的插入词Y。如果在第二处理S52处识别出插入词Y(如果S61处的决定为肯定),则信息产生器66产生这样的分发信息Q作为相关信息:其指示在第二处理S52处识别的插入词Y被插入在第一处理S51处识别的登记文本X的插入片段B中(S62)的文本。具体地,信息产生器66从指导表格TA获取在第一处理S51处识别的登记文本X的识别信息DX和在第二处理S52处识别的插入词Y的识别信息DY,并产生包含识别信息DX和DY的分发信息Q。
另一方面,如果在S52处未识别出插入词Y(如果S61处的决定为否定),则信息产生器66产生这样的分发信息Q作为相关信息:其指示与在第一处理S51处识别的登记文本X对应的修改文本Z(即,与登记文本X部分不同的文本)(S63)。具体地,信息产生器66从指导表格TA得到与登记文本X对应的修改文本Z的识别信息DZ,并产生包含该识别信息DZ的分发信息Q。
可以在指导表格TA中预先登记除了多个插入词Y之外的特定词(下文称为“特定词”),并且与多个插入词Y中的每一个类似,在第二处理S52处,可以将特定词中的每一个与输入文本L比较,以决定在输入文本L中是否包括特定词。例如,预先选择非常容易被指导人员UB错误地发音的词或可能被语音分析器62误认的词作为特定词。在输入文本L包括特定词之一的情况下,信息产生器66决定在第二处理S52处未识别出插入词Y(在S61处的决定为否定)。换句话说,除了未实际识别出插入词Y的上述示例,“未识别出插入词Y”还意在包括在输入文本L中找到除了插入词Y以外的特定词的情况。
一旦在如上所示的处理(S62或S63)处产生分发信息Q,则信息产生器66将分发信息Q从通信装置26发送到语音指导系统10的分发终端12(S7)。如上所述,在语音指导系统10中,信息处理器54和音频装置16产生包含从管理设备20接收的分发信息Q的音频信号SA作为声音成分,并且声音输出装置18输出与音频信号SA对应的声音(即,包括分发信息Q的声音)。实际上,在指导人员UB完成发出指导语音G的阶段,语音分析器62识别输入文本L,并且执行分发信息Q的产生和发送。因此,在指导语音G的声音输出之后的时间点从声音输出装置18输出分发信息Q的声音。
图5是终端装置30的框图。如图5所示,终端装置30包括声音接收装置32、控制装置34、存储装置36和呈现装置38。声音接收装置32是用于接收环境声音的音频设备(麦克风),并接收从语音指导系统10中的声音输出装置18输出的声音,以产生音频信号SB。音频信号SB包含分发信息Q的声音成分(音频信号SQ)。换句话说,声音接收装置32用作经由以空气振动充当传输介质的声音通信来接收分发信息Q的手段(接收器)。出于描述的目的,在图中省略了将声音接收装置14产生的模拟音频信号SB转换为数字格式的A/D转换器的图示。
存储装置36存储由控制装置34执行的程序和由控制装置34使用的各种数据。控制装置34是控制终端装置30的总体操作的处理装置(例如CPU)。第一实施例的控制装置34执行存储在存储装置36中的程序,从而实现用于根据分发信息Q向用户UA呈现相关信息的多个功能(信息提取器72和呈现控制器74)。
信息提取器72利用由声音接收装置32产生的音频信号SB的解调来提取分发信息Q。具体地,信息提取器72针对音频信号SB执行用于强调包括分发信息Q的声音成分的频带内的带成分的滤波处理以及与信号处理器54中的调制处理对应的解调处理,以提取分发信息Q。呈现控制器74使得呈现装置38呈现由信息提取器72提取的分发信息Q所指示的相关信息R。呈现装置38向用户UA呈现由呈现控制器74指示的相关信息R。第一实施例的呈现装置38是用于显示相关信息R的显示装置(例如,液晶显示面板)。
将存储在存储装置36中的指导表格TB用于其中呈现控制器74识别由分发信息Q指示的相关信息R的处理。如图5所示,通过指导表格TB,可由分发信息Q指示的多条相关信息R(R1、R2、...)与针对每一条的识别信息DR(DR1、DR2、...)一同被登记。识别信息DR被定义为登记文本X的识别信息DX和插入词Y的识别信息DY的组合,或者被定义修改文本Z的识别信息DZ。对于与识别信息DX和识别信息DY的组合对应的识别信息DR,通过将与识别信息DY对应的插入词Y插入到具有识别信息DX的登记文本X的插入片段B中而得到的文本被登记为相关信息R。另一方面,对于具有识别信息DZ的识别信息DR,具有相关识别信息DZ的修改文本Z被登记为相关信息R。
如果分发信息Q包含识别信息DX和识别信息DY(即,如果由于在第二处理S52处识别出插入词Y而将插入词Y插入到登记文本X中所得到的文本被指示为相关信息R),则呈现控制器74在指导表格TB中识别与识别信息DX和识别信息DY的组合相对应的识别信息DR的相关信息R,并使得呈现装置38呈现它。因此,通过将包括在输入文本L中的插入词Y插入到与指导语音G的言语内容(输入文本L)相似的登记文本X的插入片段B中而得到的文本(即,一个或多个句子大体上与指导语音G的言语内容一致)被呈现给用户UA作为相关信息R。
另一方面,如果分发信息Q包含识别信息DZ(即,如果在第二处理S52处未识别出插入词Y,因此修改文本Z被指示为相关信息R),则呈现控制器74在指导表格TB中识别与识别信息DZ相对应的识别信息DR的相关信息R,并使得呈现装置38呈现该信息。因此,从与指导语音G的言语内容相似的登记本文X部分地改变的修改文本Z(即,与指导语音G的言语内容部分地不同的一个或多个句子)被呈现给用户UA作为相关信息R。从上文的描述将会理解,登记文本X可以被定义为用于与输入文本L比较以呈现给用户UA的文本,而修改文本Z可以被定义为用于呈现给用户UA但不用于与输入文本L比较的文本。
在上述示例中,识别信息DX和识别信息DY的组合被示出为针对相关信息R的识别信息DR,但识别信息DX和识别信息DY中的每一个可以通过指导表格TB被登记为针对相关信息R(登记文本X和插入词Y)的识别信息DR。呈现控制器74可以获取具有与分发信息Q指定的识别信息DX对应的识别信息DR的相关信息R(登记文本X),获取具有与分发信息Q指定的识别信息DY对应的识别信息DR的相关信息R(插入词Y),并使得呈现装置38将通过组合相关信息R(登记文本X)和相关信息R(插入词Y)而得到的文本呈现给用户UA作为相关信息R。
图6是信息管理系统100的总体操作的说明示图。语音指导系统10的声音接收装置14接收由指导人员UB说出的指导语音G,并产生音频信号SG(S1)。音频信号SG被供给声音输出装置18并输出为声音(S2),并且从分发终端12的通信装置124被发送到管理设备20(S3)。
一旦在通信装置26处接收到音频信号SG,管理设备20就顺序地执行通过语音分析器62对输入文本L的识别(S4)、通过文本识别器64的识别处理(S5:S51、S52)、通过信息产生器66的分发信息Q的产生(S6:S61至S63)、和分发信息Q的发送(S7)。在分发终端12处,产生包括分发信息Q的声音成分的音频信号SQ(S8),并且分发信息Q被发送给终端装置30,作为声音输出装置18基于音频信号SQ对声音进行再现的结果(S9)。
终端装置30的声音接收装置32接收到由声音输出装置18输出的声音(S10)。在终端装置30中,信息提取器72从由声音接收装置32通过接收声音而产生的音频信号SB提取分发信息Q(S11),并且信息产生器66从指导表格TB获取与分发信息Q对应的相关信息R,并使得呈现装置38将该信息呈现给用户UA(S12)。因此,当听取从声音输出装置18输出的指导语音G时,用户UA可以通过呈现装置38的显示来确认与指导语音G对应的相关信息R。
从上文的描述将会理解,在第一实施例中,从多个登记文本X当中识别与由指导语音G的言语辨识所识别出的输入文本L相似的登记文本X。因此,例如与其中从指导语音G识别出的输入文本L被作为相关信息R呈现给终端装置30的用户UA的构造相比,可以在几乎不受语音辨识错误的影响的情况下,将更适合的相关信息R呈现给用户UA。
另外,由于与由文本识别器64识别的登记文本X部分地不同的修改文本Z被呈现给终端装置30的用户UA作为相关信息R,因此得到这样的优点:当预想被用作指导语音G的各登记文本X用来与输入文本L进行比较时,从登记文本X部分地改变的修改文本Z被呈现给终端装置30的用户UA。在第一实施例中,如果在第二处理S52处识别出包括在输入文本L中的插入词Y,则通过将插入词Y插入登记文本X的插入片段B中而得到的文本被呈现为相关信息R,而如果在第二处理S52处没有识别出插入词Y,则修改文本Z被呈现为相关信息R。因此,即使指导人员UB发音错误(例如,如果指导人员UB说出了除适合的词以外的词)或语音分析器62辨识错误,也可以减小将包含错误词的相关信息R呈现给用户UA的可能性。
第二实施例
现在将描述本发明的第二实施例。在以下描述中,使用相同参考符号来识别具有与第一实施例中相同的动作或功能的元件,并在适当时候省略元件的详细说明。
图7是第二实施例中的指导表格TA的示意图。如图7所示,与第一实施例类似,利用第二实施例的指导表格TA登记多个登记文本X(每个包括插入片段B)。第二实施例中的登记文本X是即使删除插入片段B也不会在语言上变得不自然的文本。具体地,利用指导表格TA对登记文本X1“[],我们已停车。非常抱歉引起延误。请等待恢复”进行登记。
在第二实施例的指导表格TA中,对于每个登记文本X,登记了可被插入登记文本X的插入片段B中的多个插入词Y。例如,对于前述登记文本X1,登记了诸如“由于车辆检查”、“由于信号故障”和“由于有人员进入铁轨”之类的多个插入词Y(Y11、Y12、Y13、...)。对于登记文本X2,“[],我们将很快停车。左侧车门将开启”,登记了诸如“在东京站”、“在秋叶原站”和“在上野站”之类的多个插入词Y(Y21、Y22、Y23、...)。在第二实施例中,修改文本Z没有登记在指导表格TA中。
图8是第二实施例中的文本识别器64和信息产生器66的操作的流程图。第一实施例中示出的图4的处理被第二实施例的图8中的处理替代。与第一实施例中相同,图8的处理在每当语音分析器62识别出输入文本L时开始。
与第一实施例类似,第二实施例的文本识别器64执行从多个登记文本X当中识别出与输入文本L类似的登记文本X的第一处理S51、以及在多个插入词Y当中搜索与对应于登记文本X的输入文本L相对应的插入词Y的第二处理S52。与第一实施例类似,信息产生器66在S61处决定在第二处理S52处是否识别出与输入文本L对应的插入词Y。如果识别出插入词Y(如果S61处的决定为肯定),则信息产生器66产生指示登记文本X与插入词Y的组合的分发信息Q(S62)。另一方面,如果在第二处理S52处未识别出插入词Y(如果S61处的决定为否定),则信息产生器66产生指示登记文本X作为相关信息R的分发信息Q(具体地,包括用于登记文本X的识别信息DX的分发信息Q)(S63),并将相关信息R从通信装置26发送到语音指导系统10(S7)。
与第一实施例类似,从声音输出装置18输出包括分发信息Q的声音,并且在终端装置30处从音频信号SB提取分发信息Q。与第一实施例类似,如果在第二处理S52处识别出插入词Y,则通过呈现装置38将与识别信息DX和识别信息DY的组合对应的相关信息R呈现给用户UA。另一方面,如果在S52处未识别出插入词Y,则将与分发信息Q所指定的识别信息DX对应的登记文本X(优选地,通过去除登记文本X的插入片段B而得到的文本)呈现给用户UA作为相关信息R。换句话说,如果在第二处理S52未识别出插入词Y,则第二实施例的信息产生器66产生对通过从登记文本X去除插入片段B而得到的文本进行指示的相关信息R作为相关信息R。
如果通知了罕见的停车原因,比如通知了“由于陨石撞击,我们已停车。非常抱歉引起延误。请等待恢复”的情况,则向用户UA呈现在语言上自然的相关信息R,即“我们已停车。非常抱歉引起延误。请等待恢复”。另外,当由于语音分析器62辨识错误而识别出错误的输入文本L时,例如,当指导语音G通知“由于车辆故障,我们已停车。非常抱歉引起延误。请等待恢复”,而错误输入文本L读作“由于公司总裁烦恼,我们已停车。非常抱歉引起延误。请等待恢复”(这里请注意,日语的“车辆故障”是“sharyou koshou”,而“公司总裁烦恼”是“syachou koshou”)时,即使在这种情况下,也向用户UA呈现语言上自然的相关信息R,即“我们已停车。非常抱歉引起延误。请等待恢复”。
在第二实施例以及第一实施例中,由于从多个登记文本X当中识别出与通过指导语音G的言语辨识而识别的输入文本L相似的登记文本X,因此可以向用户UA呈现适合的相关信息R而很少受到言语辨识错误的影响。另外,在第二实施例中,如果在第二处理S52处识别出与输入文本L对应的插入词Y,则产生将通过将插入词Y插入登记文本X的插入片段B中而得到的文本指示为相关信息R的分发信息Q,而如果在第二处理S52处未识别出与输入文本L对应的插入词Y,则产生将通过从登记文本X去除插入片段B而得到的文本指示为相关信息R的分发信息Q。因此,即使指导人员UB发音错误(例如,如果指导人员UB说出了除预计的插入词Y以外的词)或针对指导语音G作出了辨识错误,也可以减小将包含错误词的相关信息R呈现给用户UA的可能性。
第三实施例
在第三实施例中,假设信息管理系统100用来将信息提供给位于商业设施(例如购物中心)中的用户UA。在商业设施中设置了信息管理系统100的语音指导系统10,与第一实施例类似,管理设备20连接到通信网络300。
图9是第三实施例中的管理设备20中使用的指导表格TA的示意图。如图9所示,利用第三实施例的指导表格TA,登记了预期由指导人员UB说出的多个登记文本X(X1、X2、...)。第三实施例中的每个登记文本X是排除了针对每个指导可根据假设为指导语音G的言语内容而改变的部分的文本。例如,对于关于一起访问商业设施但彼此分开了的顾客而用来向客户告知分开的同伴的位置的指导语音G,“来自ABC城的XYZ正在等您。请在咨询台与他会合”,利用指导表格TA登记排除了可根据指导情景(居住地和姓名)而改变的部分的登记文本X1,“xxx正在等您。请在咨询台他会合”。符号xxx意指空栏。对于指导语音G,“停车场内车牌号为‘A区12-3456’的红色货车的车主,前灯未关闭。请返回您的车”,在指导表格TA中登记排除了可根据指导情景(车牌号)而改变的部分的登记文本X2,读作“停车场内车牌号为xxx的红色货车的车主,前灯未关闭。请返回您的车”。
如图9所示,如第一实施例中那样,第三实施例的指导表格TA包括用于与不同登记文本X对应的多个修改文本Z的识别信息DZ。与登记文本X中的任一个对应的修改文本Z是在内容上与登记文本X相似或共通、但在表达上与登记本文X部分地不同的文本。具体地,如图9所示,对于读作“xxx正在等您。请在咨询台处与他会合”的登记文本X1,登记了修改文本Z1,其读作“您的同伴正在等您。如您认识此人,请前往咨询台”,在修改文本Z1中“xxx”被“您的同伴”代替,并且“请与他会合”被“如您认识此人,请前往”代替。对于读作“停车场内车牌号为xxx的红色货车的车主,前灯未关闭。请返回您的车”的登记文本X2,登记了修改文本Z2“停车场内红色货车的车主,前灯未关闭。请返回您的车”,其中从登记文本X2删除了“车牌号为xxx”。从上文描述将会理解,登记文本X是排除了假设用于指导语音G的每个言语内容的可变部分的文本,并且尽管其与指导语音G的言语内容相似,但由于其排除了可变部分,所以在语言上是不自然的。另一方面,与登记文本X相比,修改文本Z与指导语音G的言语内容不匹配,但其在语言上是自然的文本。修改文本Z还可以被定义为排除了指导语音G的个人信息(居住地、姓名、车牌号等)的部分的文本。如果在指导表格TA中登记了用于修改文本Z的识别信息DZ,则修改文本Z本身无需登记在指导表格TA中。
图10是第三实施例中的文本识别器64和信息产生器66的操作的流程图。第一实施例中示出的图4中的处理被第三实施例中的图10中的处理代替。如在第一实施例中那样,图10的处理在每当语音分析器62识别出输入文本L时开始。
第三实施例的文本识别器64从指导表格TA的多个登记文本X当中识别出与输入文本L相似的登记文本X(SA1)。与第一实施例中示出的第一处理S51类似的处理被用于登记文本X的识别(SA1)。如上所述,在第三实施例中,由于识别出与由指导语音G的言语辨识所识别出的输入文本L相似的登记文本X,因此与第一实施例中一样,可以在言语辨识中的辨识错误几乎不造成影响的情况下,向用户UA呈现适合的相关信息R。
信息产生器66产生将与文本识别器64所识别的登记文本X对应的修改文本Z指示为相关信息R的分发信息Q(SA2)。具体地,信息产生器66产生这样的分发信息Q,其包括与指导表格TA中的登记文本X相关联的修改文本Z的识别信息DZ。信息产生器66将通过上述过程产生的分发信息Q从通信装置26发送到语音指导系统10(SA3)。
后续处理与第一实施例相同。换句话说,包括分发信息Q的声音从声音输出装置18输出。在终端装置30处,呈现装置38向用户UA呈现由从音频信号SB提取的分发信息Q所指示的修改文本Z来作为相关信息R。因此,例如,结合指导语音G“来自ABC城的XYZ正在等您。请在咨询台与他会合”,通过呈现装置38向用户UA呈现读作“您的同伴正在等您。如您认识此人,请前往咨询台”的修改文本Z1。另外,在指导语音G“停车场内车牌号为‘A区12-3456’的红色货车的车主,前灯未关闭。请返回您的车”的同时,通过呈现装置38向用户UA呈现读作“停车场内红色货车的车主,前灯未关闭。请返回您的车”的修改文本Z2。换句话说,通过呈现装置38向用户UA呈现从指导语音G排除了个人信息(居住地、姓名、车牌号等)的修改文本Z。因此,可以保护个人信息。
在第三实施例中,与第一实施例类似,由于将与文本识别器64识别的登记文本X部分地不同的修改文本Z呈现给终端装置30的用户UA作为相关信息R,因此得到如下优点:在将准备要作为指导语音G被说出的登记文本X用来与输入文本L进行比较的同时,将相对于登记文本X部分地改变的修改文本Z呈现给终端装置30的用户UA。
在上文所示的第一至第三实施例中,向用户UA呈现与指导语音G为相同语言的相关信息R,但将指导语音G翻译为其他语言的文本也可以被作为相关信息R呈现给终端装置30的用户UA。具体地,与指导语音G的语言不同的语言的文本可以在指导表格TB中登记为相关信息R。根据上文的构造,由于与指导语言G的翻译文本对应的相关信息R与指导语音G的声音再现同时地被呈现给用户UA,因此,该相关信息对于不能理解指导语音G的语言的外国人而言是有用的。
从上述示例将会理解,第一和第三实施例中的相关信息R可以被定义为与文本识别器64识别的登记文本X部分地不同的修改文本Z相对应的信息,并且除了该修改文本Z本身之外还包括修改文本Z的语音表达、翻译后的修改文本、和翻译后的修改文本的语音表达。第二实施例中的相关信息R可以被定义为与通过将插入词Y插入登记文本X的插入片段B中而得到的文本相对应的信息(见S62),或者可以被定义为与通过从登记文本X去除插入片段B而得到的文本相对应的多条信息(见S63),并且除了该文本本身外还包括文本的语音表达、翻译文本、和翻译文本的语音表达。
第四实施例
在第一至第三实施例中,从信息管理系统100发送指令终端装置30呈现相关信息R的分发信息Q。在第四实施例中,信息管理系统100产生对应于指导语音G的相关信息R,并将其提供给用户UA。语音分析器62和文本识别器64的操作与上述实施例中的相同。因此,与上述实施例类似,可以在减小了言语辨识错误的影响的情况下向用户UA呈现适当的相关信息R。
如果在第二处理S52识别出插入词Y(如果在S61处的决定为肯定),则第四实施例的信息产生器66产生从具有登记文本X(其中被插入了插入词Y)的文本被翻译为其他语言的文本,来作为相关信息R。另一方面,如果在第二处理S52未识别出插入词Y(如果在S61处的决定为否定),则信息产生器66产生从与在第一处理S51处识别的登记文本X对应的修改文本Z被翻译为其他语言的文本,来作为相关信息R。换句话说,第四实施例中的信息产生器66产生与从由文本识别器64识别的登记文本X部分地改变的修改文本Z对应的相关信息R。对于翻译文本,例如,可以以自由选择的方式采用已知的机器翻译技术。由信息产生器66产生的相关信息R被发送到语音指导系统10的分发终端12。
分发终端12的信号处理器54借助于应用于相关信息的言语合成来产生音频信号SQ。第四实施例中的音频信号SQ是表示由相关信息R指定的说出的文本的声音的信号。为了产生音频信号SQ,可以自由采用已知的言语合成。由信号处理器54产生的音频信号SQ经由音频装置16供给声音输出装置18。因此,从声音输出装置18输出由相关信息R识别的文本的言语声音。换句话说,在由指导人员UB说出指导语音G之后,从指导语音G被翻译为其他语言的另一语音从声音输出装置18输出给用户UA。例如,如果产生修改文本Z的翻译文本作为相关信息R,则在指导语音G之后输出从与指导语音G对应的登记文本X部分地改变的修改文本Z的翻译文本的言语声音。
在上文的描述中,讨论了基于第一实施例的构造,但第二实施例或第三实施例中的文本识别也可以应用于第四实施例。例如,如果在第二处理S52处识别出插入词Y(如果在S61处的决定为肯定),则第四实施例中的信息产生器66产生从具有登记文本X(其中被插入插入词Y)的文本被翻译为其他语言的文本,来作为相关信息R。另一方面,如果在第二处理S52处未识别出插入词Y(如果S61处的决定为否定),则信息产生器66产生从通过从在第一处理S51处识别的登记文本X去除插入片段B而得到的文本被翻译为其他语言的文版,来作为相关信息R。因此,在指导语音G之后从声音输出装置18输出排除了插入片段B的登记文本X的翻译文本的语音。另外,假设第三实施例,信息产生器66可以产生表示通过将与文本识别器64所识别的登记文本X对应的修改文本Z翻译为其他语言而得到的文本的相关信息R。通过该构造,结合指导语音G来输出从与指导语音G对应的登记文本X部分地改变的修改文本Z的翻译文本的语音。
从上文的描述将会理解,第四实施例中的信息管理系统100是产生与指导语音G有关的相关信息R(并向用户UA提供相关信息R)的系统,并且该信息管理系统100包括文本识别器64和信息产生器66,文本识别器64从多个登记文本X当中识别出与通过指导语音G的言语辨识而识别出的输入文本L相似的登记文本X,信息产生器66产生与文本识别器64所识别出的登记文本X对应的相关信息R。与登记文本X对应的相关信息R的典型示例为与登记文本X部分地不同的修改文本Z的翻译文本,或者删除了登记文本X的插入片段B而得到的文本的翻译文本。在上文的描述中,示出了用于从声音输出装置18输出由相关信息R指示的文本的言语声音的构造;然而,输出相关信息R的方法不限于上述示例。例如,还可以在显示装置上显示由相关信息R指示的文本。
修改
可以对上文所示的实施例进行各种修改。下面示出具体修改。只要不相互抵触,从以下变型中自由选择的两个或更多变型均可以被适当地组合。
(1)在第一至第三实施例中,显示相关信息R的显示装置被示出为呈现装置38,但还可以使用输出与相关信息R对应的声音(例如,与所说的相关信息R对应的声音)的声音输出装置(例如扬声器或耳机)作为呈现装置38。
(2)在上述实施例中,管理设备20包括语音分析器62、文本识别器64、和信息产生器66,但管理设备20的一些或所有功能可以被设置在语音指导系统10中。例如,如果语音分析器62、文本识别器64和信息产生器66位于分发终端12中作为第一至第三实施例的变型,则在分发终端12中执行音频信号SG的分析(语音分析器62)、文本X的识别(文本识别器64)和分发信息Q的产生(信息产生器66),并且分发信息Q从声音输出装置18发送到终端装置30。在各变型中,由于语音指导系统10与管理设备20之间的通信是不必要的,所以即使在不能使用通信网络300进行通信的环境中也可以有利地将分发信息Q提供到终端装置30。如果第三实施例修改为使得语音分析器62、文本识别器64和信息产生器66位于分发终端12中作为第四实施例的变型,则在分发终端12处执行音频信号SG的分析、文本X的识别和相关信息R的产生(信息产生器66),并且相关信息R从声音输出装置18(或诸如显示装置的其他输出装置)发送到用户UA。
(3)在第一实施例中,为便于描述示出了每个登记文本X包括一个插入片段B的情况,但每个登记文本X可以包括多个插入片段B。在指导表格TA中,针对登记文本X的多个插入片段B中的每一个,可以登记可被插入到插入片段B中的多个插入词Y。具体地,为了向用户UA告知列车的异常停车,可以采用这样的文本:“由于[],我们已停车。非常抱歉引起延误。请[]”。对于前一插入片段B,如在第一实施例中那样,登记诸如“车辆检查”、“信号故障”和“有人员进入铁轨”之类表达异常停车的原因的多个插入词Y。对于后一插入片段B,登记诸如“等待恢复”和“使用代替列车”之类表示请求乘客采取的行动的其他多个插入词Y。
(4)在第一实施例中,出于描述的目的已示出了每个登记文本X包括插入片段B的情况,但可以在指导表格TA中登记包括插入片段B的登记文本X和不包括插入片段B的其他登记文本X。如果文本识别器64识别出包括插入片段B的登记文本X,则执行与第一实施例中相同的处理,而如果文本识别器64识别出不包括插入片段B的登记文本X,则信息产生器66产生指示存在登记文本X或与登记文本X对应的修改文本Z的分发信息Q,而不执行对任何插入词Y的搜索(第二处理S52)。
(5)在第一至第三实施例中,在输出指导语音G之后,从声音输出装置18输出分发信息Q的声音,但可以从声音输出装置18输出分发信息Q的声音的同时输出从指导语音G翻译为其他语言的文本(即,分发信息Q可以被发送到终端装置30)。例如,可以通过已知机器翻译技术将语音分析器62识别的输入文本L或文本识别器64识别的登记文本X(以及进一步地,插入词Y)翻译为其他语言,随后可以将通过针对翻译文本的言语合成而产生的言语语音与分发信息Q的声音成分混合,并从声音输出装置18输出。例如,可以在语音指导系统10中(例如在分发终端12中)临时存储表示指导语音G的音频信号SG。随后,在通过管理设备20产生分发信息Q之后,分发信息Q的声音成分可以与保存的音频信号SG混合,以在时间上与指导语音G的言语时段重叠。换句话说,暂停输出语音G的指导声音,直到分发信息Q的产生完成为止。通过该构造,可以与指导语音G同时地输出分发信息Q的声音。
(6)存在会在与登记文本X的插入片段B对应的指导语音G的时段中说出多个插入词Y的可能性。例如,如果指导人员UB说出“由于车辆检查和信号故障,我们已停车。非常抱歉引起延误。请等待恢复”作为与图3中的登记文本X1对应的指导语音G,则语音获取器52可以指定多个插入词Y。在该情景下,信息产生器66可以产生对通过将多个插入词Y插入在第一处理S51处识别的登记文本X的一个插入片段B中而得到的文本进行指示的分发信息Q。
然而,可以针对可被插入每个登记文本X的插入片段B中的多个插入词Y预先定义优先顺序,并且可以从在第二处理S52处识别的多个插入词Y当中根据优先顺序来选择一个插入词Y(例如,具有最高优先顺序的插入词Y)。信息产生器66可以产生这样的分发信息Q作为相关信息R:其指示了其中根据优先顺序选中的插入词Y被插入登记文本Y中的文本。另外,如果在第二处理S52处识别出多个插入词Y(如果不能识别出一个插入词Y),则可以省略对登记文本X插入任何插入词Y(可以不将多个插入词Y中的任一个插入登记文本X中)。
还可以使用指示指导目标(比如交通设施)的当前情景的信息(下文称为“状态信息”)用来识别插入词Y。例如,文本识别器64可以获取指示车辆200的位置的位置信息,并可以仅从位于多个插入词Y当中由位置信息指示的位置附近的地点的名称的多个候选当中指定与输入文本L对应的插入词Y。文本识别器64还可以通过参考列车、公交车等的运行时间安排(图表)来指定多个插入词Y中的一个。
(7)在第一至第三实施例中,终端装置30的存储装置36存储了包括多条相关信息R的指导表格TB,但指导表格TB的存储位置不限于上述示例。例如,指导表格TB可以存储在经由通信网络与终端装置30通信的分布服务器设备中。终端装置30可以将对包括在分发信息Q中的识别信息进行指定的信息请求发送到分布服务器设备,并且分布服务器设备可以将与信息请求中所识别的识别信息(识别信息DR)对应的相关信息R发送到发送该请求的终端装置30。终端装置30的呈现装置38向用户UA呈现从分布服务器设备接收到的相关信息R。从上文的描述将会理解,终端装置30不是必须要存储相关信息R。还可以预先从诸如分布服务器设备或信息管理系统100(例如语音指导系统10)之类的外部设备将指导表格TB分发给终端装置30。
(8)在第一至第三实施例中,借助于使用声音作为传输介质的声音通信将分发信息Q发送到终端装置30,但用于将分发信息Q发送给终端装置30的通信方案不限于上述示例。例如,还可以使用诸如无线电波或红外线之类的电磁波作为传输介质借助于无线通信将分发信息Q从语音指导系统10发送到终端装置30。从上述示例将会理解,不使用通信网络300的近场无线通信对于分发信息Q的发送是优选的。使用声音作为传输介质的声音通信或使用电磁波作为传输介质的无线通信是近场无线通信的示例。然而,用于分发信息Q的传输方案不限于近场无线通信。例如,分发信息Q可以经由通信网络300从管理设备30发送到预先登记为信息服务目的地的终端装置30(即,可以使用推送分发)。
(9)在第一至第三实施例中,信息产生器66产生包括文本的识别信息的分发信息Q(用于登记文本X的识别信息DX、用于插入词Y的识别信息DY、和/或用于修改文本Z的识别信息DZ)。然而,信息产生器66可以产生包括文本本身(登记文本X、插入词Y和/或修改文本Z)的分发信息Q。例如,第一实施例可以被修改为:如果在第二处理S52处识别出插入词Y(S61处的决定为肯定),则产生包括这样的文本的分发信息Q,该文本包括被插入登记文本X的插入片段B中的插入词Y(S62)。如果在第二处理S52处未识别出插入词Y(S61处的决定为否定),则产生包括修改文本Z的分发信息Q(S63)。第二实施例可以被修改为:如果在第二处理S52处未识别出插入词Y,则产生包括从登记文本X去除了插入片段B的文本的分发信息Q(S63)。第三实施例可以被修改为:产生包括修改文本Z的分发信息Q(SA2)。如果分发信息Q包括如在上述示例中那样的文本,则无需在终端装置30中存储指导表格TB。在采用说出(为言语)的形式向用户UA呈现相关信息R的构造中,还可以产生表示声音本身的分发信息Q。
(10)在上述实施例中的每一个中,通过指导语音G的言语辨识来产生输入文本L,但用于产生输入文本L的方法不限于上述示例。例如,指导人员UB可以使用诸如键盘之类的操作输入装置来输入与指导语音G对应的输入文本L。从多个登记文本X当中识别出与指导人员UB输入的输入文本L相似的登记文本X。根据该示例,例如,即使在输入文本L中存在打字错误(即,即使输入文本L不同于登记文本X中的任一个),也可以呈现指导人员UB想要为用户UA提供的适当相关信息R。从上述示例将会理解,除了使用声音接收装置14的语音输入之外,对输入文本L的“输入”还包括例如借助于诸如键盘之类的操作输入装置的输入。因此,对于输入文本L的识别,指导语音G的言语辨识并非是必须的。
(11)在上述实施例中的每一个中,信息管理系统100用来提供交通设施或商业设施中的信息,但使用信息管理系统100的场景不限于上述示例。还可以在各种娱乐设施中使用信息管理系统100,比如表演戏剧作品的剧场。例如,可以从信息管理系统100向终端装置30发送这样的分发信息Q:其用于向用户设备30呈现作为戏剧作品中的台词而被说出的指导语音G的相关信息。
(12)根据上述方式中的每一个的信息管理系统100通过控制装置22和程序的协作而实现,如上述实施例中所示。例如,根据第一实施例或第三实施例的程序是这样的程序,其用于产生用于将相关信息指示给终端装置30的分发信息Q,所述终端装置30将与指导语音G有关的相关信息R呈现给用户UA。该程序使得计算机用作这样的文本识别器64和信息产生器66:文本识别器64从多个不同的登记文本X当中识别出与由指导语音G的言语辨识所识别的输入文本L相似的登记文本X,信息产生器66产生将与文本识别器64所识别的登记文本X部分地不同的修改文本Z作为相关信息R指示给终端装置30的分发信息Q。根据第四实施例的程序使得计算机用作这样的文本识别器64和信息产生器66:文本识别器64识别出与输入文本L相似的登记文本X,信息产生器66产生与文本识别器64所识别的登记文本X部分地不同的修改文本Z对应的相关信息R。上文所示的程序可以以存储在计算机可读记录介质中的形式被提供并安装在计算机中。记录介质例如为非暂时性记录介质,优选地为光学记录介质(光盘),比如CD-ROM,但可以包括任何类型的已知记录介质,比如半导体记录介质和磁记录介质。还可以以分发的形式经由通信网络将程序提供给计算机。
(13)根据上文所示的实施例和修改,可以如下掌握本发明的优选方式。
方式1
根据本发明一个优选方式(方式1)的信息管理系统是用于产生如下分发信息的信息管理系统,该分发信息用于向终端装置指示有关指导语音的相关信息以用于通过终端装置向用户呈现相关信息,该系统包括:文本识别器,其构造为从多个不同的登记文本当中识别出与表示所述指导语音的输入文本相似的登记文本;以及信息产生器,其构造为产生这样的分发信息:其向所述终端装置指示与由所述文本识别器识别出的登记文本部分地不同的修改文本相对应的相关信息。在方式1中,从多个登记文本当中识别出与表示指导语音的输入文本相似的登记文本。因此,与例如其中将由针对指导语音的言语辨识分析所识别出的输入文本或由指导人员录入的输入字符作为相关信息呈现给终端装置的用户的构造相比,可以将更适合的相关信息呈现给用户。另外,产生了这样的分发信息:其向终端装置指示与由文本识别器识别出的登记文本部分地不同的修改文本相对应的相关信息。因此,得到的优点是,同时,意图用作指导语音的登记文本用来与输入文本进行比较的同时,在与登记文本部分地不同的相关信息被呈现给终端装置的用户。例如,可以向用户呈现以下相关信息:通过从指导语音去除不适合从终端装置向用户呈现的项(例如个人信息)而得到的相关信息、或者通过修改不便于利用言语辨识进行处理的部分而得到的适当的相关信息。上述第一实施例和第三实施例对应于方式1的示例。
方式2
在方式1的优选示例(方式2)中,所述登记文本中的每一个包括其中插入了多个插入词中的选中的一个的插入片段,其中所述文本识别器构造为执行从所述多个登记文本当中识别出与所述输入文本相似的登记文本的第一处理、以及在所述多个插入词当中搜索与该登记文本的输入文本对应的插入词的第二处理,并且所述信息产生器构造为:在所述第二处理识别出与所述输入文本对应的插入词的情况下,产生这样的分发信息:其指示与通过将在所述第二处理识别出的插入词插入在所述第一处理识别出的登记文本的插入片段中而得到的文本对应的相关信息,而在所述第二处理未识别出与所述输入文本对应的插入词的情况下,产生这样的分发信息:其指示与在所述第一处理识别出的登记文本部分地不同的修改文本相对应的相关信息。在方式2中,如果在第二处理识别出对应于输入文本的插入词,则产生指示与通过将插入词插入登记文本的插入片段中而得到的文本相对应的相关信息的分发信息,而如果在第二处理未识别出对应于输入文本的插入词,则产生指示与部分地不同于登记文本的修改文本相对应的相关信息的分发信息。因此,即使指导人员发音错误(例如,如果指导人员说出了除预计的插入词以外的词)或对指导语音发生了辨识错误,也可以减小向用户呈现包含不适当的词的相关信息的可能性。上述第一实施例对应于方式2的示例。
方式3
在方式1的优选示例(方式3)中,所述信息产生器构造为产生指示与通过删除由所述文本识别器识别出的登记文本的一部分而得到的修改文本对应的相关信息的分发信息。在方式3中,产生了指示与通过删除登记文本的一部分而得到的修改文本对应的相关信息的分发信息。因此,例如,可以向用户呈现通过从指导语音中删除不适合从终端装置向用户呈现的信息(例如个人信息)而得到的相关信息。第三实施例对应于方式3的示例。
方式4
根据本发明的优选方式(方式4)的信息管理系统是这样一种信息管理系统,其用于产生如下分发信息,所述分发信息用于向终端装置指示有关指导语音的相关信息以通过所述终端装置向用户呈现所述相关信息,并且所述系统包括:文本识别器,其构造为从多个不同的登记文本当中识别出与表示所述指导语音的输入文本相似的登记文本;以及信息产生器,其构造为产生这样的分发信息:其向所述终端装置指示由所述文本识别器识别出的登记文本,所述登记文本中的每一个包括用于插入多个插入词中的选中的一个的插入片段,其中所述文本识别器构造为执行从所述多个登记文本当中识别出与所述输入文本相似的登记文本的第一处理、以及在所述多个插入词当中搜索与该输入文本对应的插入词的第二处理,并且所述信息产生器构造为:在所述第二处理识别出与所述输入文本对应的插入词的情况下,产生这样的分发信息:其指示与通过将在所述第二处理识别出的插入词插入在所述第一处理识别出的登记文本的插入片段中而得到的文本对应的相关信息,而在所述第二处理未识别出与所述输入文本对应的插入词的情况下,产生这样的分发信息:其指示对应于与去除了所述插入片段的登记文本对应的文本的相关信息。在方式4中,从多个登记文本当中识别出与表示指导语音的输入文本相似的登记文本。因此,与例如其中将通过用于指导语音的言语识别分析而识别出的输入文本或者通过指导人员录入的输入字符作为相关信息呈现给终端装置的用户的构造相比,可以向用户呈现更适合的相关信息。另外,如果在第二处理识别出对应于输入文本的插入词,则产生指示与通过将插入词插入登记文本的插入片段中而得到的文本相对应的相关信息的分发信息,而如果在第二处理未识别出对应于输入文本的插入词,则产生指示与对应于去除了插入片段的登记文本的文本相对应的相关信息的分发信息。因此,即使指导人员发音错误(例如,如果指导人员说出了除预计的插入词以外的词)或对指导语音发生了辨识错误,也可以减小向用户呈现包含不正确的词的相关信息的可能性。第二实施例对应于方式4的示例。
方式5
在方式1至4中任一项的优选示例(方式5)中,所述信息管理系统还包括声音输出器,其构造为输出所述指导语音并且输出包括所述分发信息的声音以将所述分发信息发送到所述终端装置。在方式5中,输出指导语音的声音输出器还用于分发信息的声音输出(即,利用声音通过将空气振动用作传输介质而进行的声音通信)。因此,与其中借助于与用于指导语音的声音输出的声音输出器不同的装置来将分发信息发送给终端装置的构造相比,可以简化信息管理系统的构造。
方式6
根据本发明一个优选方式(方式6)的信息管理系统是用于产生有关指导语音的相关信息的信息管理系统,其包括:文本识别器,其构造为从多个不同的登记文本当中识别出与表示所述指导语音的输入文本相似的登记文本;以及信息产生器,其构造为产生与由所述文本识别器识别出的登记文本部分地不同的修改文本相对应的相关信息。在方式6中,从多个登记文本当中识别出了与表示指导语音的输入文本相似的登记文本。因此,与例如其中将通过指导语音的言语辨识而识别出的输入文本或通过指导人员录入的输入字符作为相关信息呈现给终端装置的用户的构造相比,可以向用户呈现更适合的相关信息。另外,产生了与由文本识别器识别出的登记文本部分不同的修改文本相对应的相关信息(例如,修改文本的翻译文本)。因此,优点是,当将预想用于指导语音的登记文本用于与输入文本进行比较时,向用户呈现部分地不同于登记文本的相关信息。第三实施例对应于方式6的示例。
方式7
在方式1至6中任一项的优选示例(方式7)中,所述文本识别器构造为从所述多个登记文本当中识别出与通过所述指导语音的言语辨识而识别出的输入文本相似的登记文本。在方式7中,由于通过指导语音的言语辨识来识别输入文本,因此优点是指导人员无需手动输入输入文本。
方式8
根据本发明一个优选方式(方式8)的信息管理方法是这样一种信息管理方法,其用于产生如下分发信息,所述分发信息用于向终端装置指示有关指导语音的相关信息以通过所述终端装置向用户呈现所述相关信息,并且所述方法包括:从多个不同的登记文本当中识别出与表示所述指导语音的输入文本相似的登记文本;以及产生这样的分发信息:其向所述终端装置指示与所识别出的登记文本部分地不同的修改文本相对应的相关信息。根据方式8,实现了与根据方式1的信息管理系统相同的效果。
方式9
根据本发明一个优选方式(方式9)的信息管理方法是这样一种信息管理方法,其用于产生如下分发信息,所述分发信息用于向终端装置指示有关指导语音的相关信息以通过所述终端装置向用户呈现所述相关信息,并且所述方法包括:从多个不同的登记文本当中识别出与表示所述指导语音的输入文本相似的登记文本;以及产生向所述终端装置指示识别出的登记文本的分发信息,所述登记文本中的每一个包括其中插入多个插入词中的选中的一个的插入片段,并且登记文本的识别包括:执行从所述多个登记文本当中识别出与所述输入文本相似的登记文本的第一处理、以及在所述多个插入词当中搜索与该输入文本对应的插入词的第二处理。分发信息的产生包括:在所述第二处理识别出与所述输入文本对应的插入词的情况下,产生这样的分发信息,其指示与通过将在所述第二处理识别出的插入词插入在所述第一处理识别出的登记文本的插入片段中而得到的文本对应的相关信息,而在所述第二处理未识别出与所述输入文本对应的插入词的情况下,产生这样的分发信息,其指示对应于与去除了所述插入片段的登记文本对应的文本的相关信息。根据方式9,实现了与根据方式4的信息管理系统中的相同的效果。
方式10
根据本发明一个优选方式(方式10)的信息管理方法是用于产生有关指导语音的相关信息的信息管理方法,并且所述方法包括:从多个不同的登记文本当中识别出与表示所述指导语音的输入文本相似的登记文本;以及产生对应于与识别出的登记文本部分地不同的修改文本的相关信息。根据方式10,实现了与根据方式6的信息管理系统中的相同的效果。
参考符号列表
100:信息管理系统
200:车辆
300:通信网络
10:语音指导系统
12:分发终端
122:控制装置
124:通信装置
14:声音接收装置
16:音频装置
18:声音输出装置
20:管理设备
22:控制装置
24:存储装置
26:通信装置
30:终端装置
32:声音接收装置
34:控制装置
36:存储装置
38:呈现装置
52:语音获取器
54:信号处理器
62:语音分析器
64:文本识别器
66:信息产生器
72:信息提取器
74:呈现控制器
Claims (10)
1.一种信息管理系统,其用于产生这样的分发信息,所述分发信息用于向终端装置指示有关指导语音的相关信息以通过所述终端装置向用户呈现所述相关信息,所述信息管理系统包括:
文本识别器,其构造为从不同的多个登记文本当中识别出与表示所述指导语音的输入文本相似的登记文本;以及
信息产生器,其构造为产生这样的分发信息:该分发信息向所述终端装置指示与由所述文本识别器识别出的登记文本部分地不同的修改文本所对应的相关信息。
2.根据权利要求1所述的信息管理系统,
其中所述多个登记文本中的每一个包括其中插入了多个插入词中的选中的一个的插入片段,
其中所述文本识别器构造为执行从所述多个登记文本当中识别出与所述输入文本相似的登记文本的第一处理、以及在所述多个插入词当中搜索与该登记文本的所述输入文本相对应的插入词的第二处理,并且
其中所述信息产生器构造为:在所述第二处理处识别出与所述输入文本相对应的插入词的情况下,产生这样的分发信息:该分发信息指示与通过将在所述第二处理处识别出的插入词插入至在所述第一处理处识别出的登记文本的插入片段中而得到的文本相对应的相关信息,而
在所述第二处理处未识别出与所述输入文本相对应的插入词的情况下,产生这样的分发信息:该分发信息指示与在所述第一处理处识别出的登记文本部分地不同的修改文本所对应的相关信息。
3.根据权利要求1所述的信息管理系统,其中所述信息产生器构造为产生这样的分发信息:该分发信息指示与通过删除由所述文本识别器识别出的登记文本的一部分而得到的修改文本相对应的相关信息。
4.一种信息管理系统,其用于产生这样的分发信息,所述分发信息用于向终端装置指示有关指导语音的相关信息以通过所述终端装置向用户呈现所述相关信息,所述系统包括:
文本识别器,其构造为从不同的多个登记文本当中识别出与表示所述指导语音的输入文本相似的登记文本;以及
信息产生器,其构造为产生这样的分发信息:该分发信息向所述终端装置指示由所述文本识别器识别出的登记文本,
其中所述多个登记文本中的每一个包括用于插入多个插入词中的选中的一个的插入片段,
其中所述文本识别器构造为执行从所述多个登记文本当中识别出与所述输入文本相似的登记文本的第一处理、以及在所述多个插入词当中搜索与该输入文本相对应的插入词的第二处理,并且
其中所述信息产生器构造为:在所述第二处理处识别出与所述输入文本相对应的插入词的情况下,产生这样的分发信息:该分发信息指示与通过将在所述第二处理处识别出的插入词插入至在所述第一处理处识别出的登记文本的插入片段中而得到的文本相对应的相关信息,而
在所述第二处理处未识别出与所述输入文本相对应的插入词的情况下,产生这样的分发信息:该分发信息指示与去除了所述插入片段的登记文本相对应的文本所对应的相关信息。
5.根据权利要求1至4中任一项所述的信息管理系统,还包括:
声音输出器,其构造为输出所述指导语音并且输出包括所述分发信息的声音以将所述分发信息发送到所述终端装置。
6.一种信息管理系统,其用于产生有关指导语音的相关信息,所述信息管理系统包括:
文本识别器,其构造为从不同的多个登记文本当中识别出与表示所述指导语音的输入文本相似的登记文本;以及
信息产生器,其构造为产生与由所述文本识别器识别出的登记文本部分地不同的修改文本所对应的相关信息。
7.根据权利要求1至6中任一项所述的信息管理系统,其中所述文本识别器构造为从所述多个登记文本当中识别出与通过所述指导语音的言语辨识而识别出的输入文本相似的登记文本。
8.一种信息管理方法,其用于产生这样的分发信息,所述分发信息用于向终端装置指示有关指导语音的相关信息以通过所述终端装置向用户呈现所述相关信息,所述方法包括:
从不同的多个登记文本当中识别出与表示所述指导语音的输入文本相似的登记文本;以及
产生这样的分发信息:该分发信息向所述终端装置指示与所识别出的登记文本部分地不同的修改文本所对应的相关信息。
9.一种信息管理方法,其用于产生这样的分发信息,所述分发信息用于向终端装置指示有关指导语音的相关信息以通过所述终端装置向用户呈现所述相关信息,所述方法包括:
从不同的多个登记文本当中识别出与表示所述指导语音的输入文本相似的登记文本;以及
产生向所述终端装置指示识别出的登记文本的分发信息,
其中所述多个登记文本中的每一个包括其中插入了多个插入词中的选中的一个的插入片段,
其中,在登记文本的识别中,执行从所述多个登记文本当中识别出与所述输入文本相似的登记文本的第一处理、以及在所述多个插入词当中搜索与该输入文本相对应的插入词的第二处理,并且
其中,在所述分发信息的产生中,在所述第二处理处识别出与所述输入文本相对应的插入词的情况下,产生这样的分发信息:该分发信息指示与通过将在所述第二处理处识别出的插入词插入在所述第一处理处识别出的登记文本的插入片段中而得到的文本相对应的相关信息,而
在所述第二处理处未识别出与所述输入文本相对应的插入词的情况下,产生这样的分发信息:该分发信息指示与去除了所述插入片段的登记文本相对应的文本所对应的相关信息。
10.一种信息管理方法,其用于产生有关指导语音的相关信息,所述方法包括:
从不同的多个登记文本当中识别出与表示所述指导语音的输入文本相似的登记文本;以及
产生与识别出的登记文本部分地不同的修改文本所对应的相关信息。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015203863 | 2015-10-15 | ||
JP2015-203863 | 2015-10-15 | ||
PCT/JP2016/080523 WO2017065266A1 (ja) | 2015-10-15 | 2016-10-14 | 情報管理システムおよび情報管理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108140384A true CN108140384A (zh) | 2018-06-08 |
Family
ID=58517283
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201680060063.3A Withdrawn CN108140384A (zh) | 2015-10-15 | 2016-10-14 | 信息管理系统和信息管理方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20180225283A1 (zh) |
EP (1) | EP3364409A4 (zh) |
JP (2) | JP6160794B1 (zh) |
CN (1) | CN108140384A (zh) |
WO (1) | WO2017065266A1 (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6630139B2 (ja) * | 2015-12-07 | 2020-01-15 | 東日本旅客鉄道株式会社 | テキストデータ加工装置、文字化放送表示システム及び文字化放送表示プログラム |
KR102580904B1 (ko) * | 2016-09-26 | 2023-09-20 | 삼성전자주식회사 | 음성 신호를 번역하는 방법 및 그에 따른 전자 디바이스 |
JP6927942B2 (ja) * | 2018-10-23 | 2021-09-01 | Toa株式会社 | 放送装置、放送システム、及びコンピュータプログラム |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1764944A (zh) * | 2003-03-26 | 2006-04-26 | 皇家飞利浦电子股份有限公司 | 语音识别系统 |
CN101236743A (zh) * | 2007-01-30 | 2008-08-06 | 国际商业机器公司 | 生成高质量话音的系统和方法 |
US20090299730A1 (en) * | 2008-05-28 | 2009-12-03 | Joh Jae-Min | Mobile terminal and method for correcting text thereof |
US20130158980A1 (en) * | 2011-12-15 | 2013-06-20 | Microsoft Corporation | Suggesting intent frame(s) for user request(s) |
CN103189912A (zh) * | 2010-10-21 | 2013-07-03 | 雅马哈株式会社 | 声音处理设备和声音处理方法 |
US20150161521A1 (en) * | 2013-12-06 | 2015-06-11 | Apple Inc. | Method for extracting salient dialog usage from live data |
CN107710322A (zh) * | 2015-06-24 | 2018-02-16 | 雅马哈株式会社 | 信息提供系统、信息提供方法和计算机可读记录介质 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040085162A1 (en) * | 2000-11-29 | 2004-05-06 | Rajeev Agarwal | Method and apparatus for providing a mixed-initiative dialog between a user and a machine |
US7331036B1 (en) * | 2003-05-02 | 2008-02-12 | Intervoice Limited Partnership | System and method to graphically facilitate speech enabled user interfaces |
DE102009052675A1 (de) * | 2009-11-12 | 2011-05-19 | Deutsche Telekom Ag | Verfahren zur Verteilung von Informationen an mobile Endgeräte |
JP2012063611A (ja) * | 2010-09-16 | 2012-03-29 | Nec Corp | 音声認識結果検索装置、音声認識結果検索方法および音声認識結果検索プログラム |
JP2014075067A (ja) * | 2012-10-05 | 2014-04-24 | Zenrin Datacom Co Ltd | 交通機関案内メッセージ提供システム、交通機関案内メッセージ提供装置、携帯通信端末および交通機関案内メッセージ提供方法 |
EP3005152B1 (en) * | 2013-05-30 | 2024-03-27 | Promptu Systems Corporation | Systems and methods for adaptive proper name entity recognition and understanding |
US10176167B2 (en) * | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
JP6114249B2 (ja) * | 2014-11-20 | 2017-04-12 | ヤマハ株式会社 | 情報送信装置および情報送信方法 |
-
2016
- 2016-10-14 CN CN201680060063.3A patent/CN108140384A/zh not_active Withdrawn
- 2016-10-14 EP EP16855519.1A patent/EP3364409A4/en not_active Withdrawn
- 2016-10-14 WO PCT/JP2016/080523 patent/WO2017065266A1/ja active Application Filing
- 2016-10-14 JP JP2017503964A patent/JP6160794B1/ja active Active
-
2017
- 2017-05-29 JP JP2017105418A patent/JP6729494B2/ja active Active
-
2018
- 2018-04-10 US US15/949,595 patent/US20180225283A1/en not_active Abandoned
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1764944A (zh) * | 2003-03-26 | 2006-04-26 | 皇家飞利浦电子股份有限公司 | 语音识别系统 |
CN101236743A (zh) * | 2007-01-30 | 2008-08-06 | 国际商业机器公司 | 生成高质量话音的系统和方法 |
US20090299730A1 (en) * | 2008-05-28 | 2009-12-03 | Joh Jae-Min | Mobile terminal and method for correcting text thereof |
CN103189912A (zh) * | 2010-10-21 | 2013-07-03 | 雅马哈株式会社 | 声音处理设备和声音处理方法 |
US20130158980A1 (en) * | 2011-12-15 | 2013-06-20 | Microsoft Corporation | Suggesting intent frame(s) for user request(s) |
US20150161521A1 (en) * | 2013-12-06 | 2015-06-11 | Apple Inc. | Method for extracting salient dialog usage from live data |
CN107710322A (zh) * | 2015-06-24 | 2018-02-16 | 雅马哈株式会社 | 信息提供系统、信息提供方法和计算机可读记录介质 |
Also Published As
Publication number | Publication date |
---|---|
JP2017161937A (ja) | 2017-09-14 |
JP6160794B1 (ja) | 2017-07-12 |
WO2017065266A1 (ja) | 2017-04-20 |
EP3364409A1 (en) | 2018-08-22 |
JPWO2017065266A1 (ja) | 2017-10-19 |
EP3364409A4 (en) | 2019-07-10 |
JP6729494B2 (ja) | 2020-07-22 |
US20180225283A1 (en) | 2018-08-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107710322B (zh) | 信息提供系统、信息提供方法和计算机可读记录介质 | |
US8077877B1 (en) | Courtesy announcement system and method of using | |
CN105005431A (zh) | 听写设备及其数据处理方法和相关装置 | |
US7020612B2 (en) | Facility retrieval apparatus and method | |
CN106537497A (zh) | 信息管理系统和信息管理方法 | |
CN109346057A (zh) | 一种智能儿童玩具的语音处理系统 | |
CN108140384A (zh) | 信息管理系统和信息管理方法 | |
WO2015022992A1 (ja) | 情報処理装置及びその制御方法、コンピュータプログラム | |
KR20160081244A (ko) | 자동 통역 시스템 및 이의 동작 방법 | |
JP6569252B2 (ja) | 情報提供システム、情報提供方法およびプログラム | |
US10216732B2 (en) | Information presentation method, non-transitory recording medium storing thereon computer program, and information presentation system | |
US20020178001A1 (en) | Telecommunication apparatus and methods | |
Froholdt | ‘I see you on my radar’: displays of the confirmatory form in maritime technologically mediated interaction | |
JP6832503B2 (ja) | 情報提示方法、情報提示プログラム及び情報提示システム | |
JP6860105B2 (ja) | プログラム、端末装置の動作方法および端末装置 | |
WO2019003395A1 (ja) | コールセンター会話内容表示システム、方法及びプログラム | |
CN108877795B (zh) | 用于呈现信息的方法和装置 | |
JP7175069B2 (ja) | 異常時放送外国語化システム及び異常時放送外国語化プログラム | |
JPWO2020036189A1 (ja) | 応対履歴作成支援装置、応対履歴作成支援方法、データ構造、プログラム、表示装置、及び編集支援装置 | |
EP3223275B1 (en) | Information transmission device, information transmission method, guide system, and communication system | |
JP6596903B2 (ja) | 情報提供システムおよび情報提供方法 | |
JP2004266551A (ja) | ストリームデータ生成装置、ストリームデータ生成システム、ストリームデータ生成方法及びプログラム | |
KR102011595B1 (ko) | 청각 장애인을 위한 소통 지원 장치 및 방법 | |
US11250704B2 (en) | Information provision device, terminal device, information provision system, and information provision method | |
CN112201225A (zh) | 一种语料获取的方法、装置、可读存储介质和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20180608 |