CN106537497A

CN106537497A - 信息管理系统和信息管理方法

Info

Publication number: CN106537497A
Application number: CN201580040546.2A
Authority: CN
Inventors: 森口翔太; 岩田贵裕; 濑户优树
Original assignee: Yamaha Corp
Current assignee: Yamaha Corp
Priority date: 2014-07-29
Filing date: 2015-07-27
Publication date: 2017-03-22
Anticipated expiration: 2035-07-27
Also published as: KR20170033428A; EP3176783B1; JP2016076201A; KR101942678B1; US20170212720A1; WO2016017576A1; AU2015297647B2; US10691400B2; KR20170125414A; AU2015297647A1; CN106537497B; EP3176783A1; JP5887446B1; EP3176783A4; KR101796428B1

Abstract

本信息管理系统设置有：音频信号获取器，其获取表示导览语音的音频信号；相关信息获取器，其获取与该导览语音有关的相关信息；关联管理器，其将连同与该音频信号相对应的导览语音的发射一起通知给终端装置的识别信息与相关信息获取器针对该导览语音而获取的相关信息相关联；以及信息提供器，其从终端装置接收包括通知给该终端装置的识别信息的信息请求并将通过关联管理器与识别信息关联的相关信息发送至终端装置。

Description

信息管理系统和信息管理方法

技术领域

本发明涉及用于向终端装置的用户提供信息的技术。

背景技术

已提出各种技术来充当为展览设施(比如美术馆和博物馆)中的访客进行的导览。例如，专利文献1公开了一种个人导览系统，其包括由访客携带的便携式再现单元。在便携式再现单元中预先存储有音频讲解，并且该便携式再现单元响应于从展览品附近的发送装置发送的一条相应代码信息而再现各讲解。类似地，专利文献2公开了一种导览方法，其中，从预先存储在由展览设施中的访客携带的便携式收发单元中的各条展览品数据(例如，关于展览品的说明图像和语音)中，选择与从位于各展览品附近的固定式收发装置发送的识别信号相对应的一条展览品数据，并根据所选择的该条数据再现关于展览品的说明图像和语音。

现有技术文献

专利文献

专利文献1：日本专利申请公开No.H02-190888

专利文献2：日本专利申请公开No.2002-259612

发明内容

本发明解决的技术问题

在专利文献1和2公开的技术中，选择性地再现预先存储在由用户携带的便携式终端装置(专利文献1中的再现单元或专利文献2中的便携式收发单元)中的信息。因此，这些技术的缺点在于要求终端装置具有大存储容量。在以上描述中，给出诸如美术馆和博物馆之类的展览设施作为示例。但是，在向用户提供各种信息的任何场合中(比如，在例如火车或公交车等的交通系统中的语音导览的情况下)都会存在与上述关于存储容量的问题相类似的问题。鉴于所述问题，本发明的目的在于使得能够向用户提供各种信息，同时还使得与现有技术相比终端装置的所需存储容量减小。

解决问题的手段

为了解决所述问题，根据本发明的信息管理系统包括：音频信号获取装置，其构造为获取表示用于再现的声音的音频信号；相关信息获取装置，其构造为获取与所述用于再现的声音有关的一条相关信息；关联管理装置，其构造为将所述相关信息获取装置针对所述用于再现的声音获取的所述一条相关信息与一旦发射与所述音频信号对应的所述用于再现的声音就通知给终端装置的一条识别信息相关联；和信息提供装置，其构造为从所述终端装置接收包括通知给所述终端装置的所述一条识别信息的信息请求，并向所述终端装置发送通过所述关联管理装置而与所述一条识别信息相关联的所述一条相关信息。在上述构造中，将一旦发射用于再现的声音就通知给终端装置的识别信息和与用于再现的声音有关的相关信息彼此关联，并且将与通知给终端装置的识别信息相对应的相关信息提供给终端装置。因此，与专利文献1和2中公开的技术相比，优点在于，可以减小终端装置用于存储相关信息的所需存储容量。

在本发明的优选模式中，所述信息管理系统还包括：信号处理装置，其构造为产生音频信号，该音频信号包括所述音频信号获取装置获取的音频信号和包括所述一条识别信息的调制的信号。在上述模式中，由于产生了在其中包括了用于再现的声音的音频信号和包括用于再现的声音的所述一条识别信息的调制的信号的音频信号，因此一旦发射与所产生的音频信号相对应的声音，就可以向所述终端装置通知所述一条识别信息。因此，优点在于，通过使用利用能够发射和接收声音的部件的简单构造就可以发送和接收识别信息。

在本发明的优选模式中，信号处理装置将包括各条识别信息的各个调制的信号添加至各再现部分，所述各再现部分是通过所述音频信号获取装置获取的音频信号的时间轴分开部分，其中，各调制的信号中的各条识别信息在各再现部分之间彼此不同。关联管理装置将所述相关信息获取装置针对每个再现部分获取的一条相关信息与对应于该再现部分的一条识别信息相关联。在上述模式中，用于再现的声音被分为各再现部分，并且在每个再现部分中包括具有不同识别信息的调制的信号。此外，对于每个再现部分，所述一条识别信息与相应一条相关信息相关联。通过该构造，可以结合发射用于再现的声音的进程来改变发送至终端装置的一条相关信息。

在本发明的优选模式中，所述音频信号获取装置通过语音合成产生指示了所述用于再现的声音的音频信号，所述用于再现的声音是与来自用户的指令相符合的字符串的发音声(spoken rendition)。在上述模式中，由于通过语音合成来产生指示了用于再现的声音的音频信号，因此，优点在于，无需预先记录用于再现的声音。在本发明的优选模式中，相关信息获取装置通过指示了所述用于再现的声音的发音内容的字符串的机器翻译来产生指示了所述用于再现的声音的翻译的一条相关信息。因此，优点在于，无需预先准备与用于再现的声音的语言不同的语言的相关信息。可以随意选择音频信号获取装置获取音频信号的方式以及相关信息获取装置获取相关信息的方式。例如，可以采用音频信号获取装置从输出音频信号的信号供应装置获取用于再现的声音的音频信号的构造。替代性地或额外地，可以采用相关信息获取装置获取指示了与用于再现的声音有关的图像的相关信息。

在本发明的优选模式中，相关信息获取装置通过指示了所述用于再现的声音的发音内容的字符串的机器翻译来产生指示了所述用于再现的声音的翻译的字符串，并且进一步通过语音合成产生指示了指示所述翻译的字符串的发音声的音频信号作为所述一条相关信息，该音频信号从而指示了所述用于再现的声音的翻译。在上述模式中，通过机器翻译产生指示了用于再现的声音的翻译的字符串，并且通过语音合成产生作为指示了所述翻译的字符串的发音声且指示了用于再现的声音的音频信号作为所述相关信息。因此，并行于第一语言的用于再现的声音的发射，终端装置对与用于再现的声音的原始语言(第一语言)不同的第二语言的用于再现的声音进行再现。因此，优点在于，即使终端装置的用户无法理解第一语言的用于再现的声音，该用户通过聆听第二语言的用于再现的声音也能够理解再现的内容。

在本发明的优选模式中，相关信息获取装置获取与所述用于再现的声音相关的图像作为所述一条相关信息。在该构造中，获取与用于再现的声音有关的图像作为相关信息。因此，优点在于，无需在终端装置中预先存储与用于再现的声音有关的图像。当在终端装置上存储数据大小较大的图像数据时，该终端装置的大量存储容量被占用。在本发明中，可以极大减小终端装置存储与用于再现的声音的有关的图像所需的存储容量。

在本发明的优选模式中，音频信号获取装置获取指示了所述用于再现的声音的音频信号，该音频信号从信号供应装置供应，并且相关信息获取装置通过语音识别、根据从所述信号供应装置供应的音频信号产生指示了所述用于再现的声音的发音内容的字符串作为所述一条相关信息。在上述构造中，根据从信号供应装置供应且指示了用于再现的声音的音频信号来产生指示了所述用于再现的声音的发音内容的字符串。因此，优点在于，信息管理系统不需要管理员来单独指定该字符串作为指定字符串。此外，连同用于再现的声音的发射，在显示装置上显示用于再现的声音的字符串。因此，优点在于，即使当用户使用未配备有单独获取和存储指示了用于再现的声音的发音内容的字符串的装置时、在错过所发射的用于再现的声音时或者在用户具有聆听用于再现的声音的困难(例如，弱听力人士)的情况下，用户也能够在他/她的终端装置上查看用于再现的声音的内容。此外，可以由此减小终端装置用于存储指示了用于再现的声音的发音内容的字符串的所需存储容量。

在本发明的优选模式中，音频信号获取装置可以获取指示了所述用于再现的声音的音频信号，该音频信号从信号供应装置供应，并且所述相关信息获取装置可以通过语音识别、根据从所述信号供应装置供应的音频信号产生指示了所述用于再现的声音的发音内容的字符串，并且通过所产生的字符串的机器翻译，可以产生指示了所述用于再现的声音的翻译的所述一条相关信息。在该情况下，通过对指示了用于再现的声音的发音内容的字符串进行机器翻译来产生相关信息。因此，进一步的优点在于，无需预先准备与用于再现的声音的语言不同的语言的相关信息。

在本发明的优选模式中，音频信号获取装置获取指示了所述用于再现的声音的音频信号，该音频信号从信号供应装置供应。相关信息获取装置通过语音识别、根据从所述信号供应装置供应的音频信号产生指示了所述用于再现的声音的发音内容的字符串，并且通过所产生的字符串的机器翻译，产生指示了所述用于再现的声音的翻译的字符串，并且还通过语音合成产生指示了指示所述翻译的字符串的发音声的音频信号作为所述一条相关信息，该音频信号从而指示了所述用于再现的声音的翻译。在上述模式中，并行于用于再现的声音的发射，通过终端装置以与用于再现的声音的第一语言不同的第二语言来再现用于再现的声音。因此，优点在于，即使终端装置的用户无法理解第一语言的用于再现的声音，该用户通过聆听第二语言的用于再现的声音也将能够理解再现的内容。

在本发明的优选模式中，音频信号获取装置获取指示了所述用于再现的声音的音频信号，该音频信号从信号供应装置供应。相关信息获取装置通过语音识别、根据从所述信号供应装置供应的音频信号产生指示了所述用于再现的声音的发音内容的字符串，并且获取指示了所述用于再现的声音的翻译并通过输入装置上执行的操作而被指定为所产生的字符串的翻译的字符串，作为所述一条相关信息。在该模式中，获取指示了第一语言的字符串的管理员人工翻译的结果的字符串作为相关信息。因此，与通过机器翻译产生指示了用于再现的声音的翻译的字符串的情况相比，可以获取具有更高质量的导览语音V的第二语言书面翻译。

在本发明的优选模式中，音频信号获取装置获取指示了所述用于再现的声音的音频信号，该音频信号从信号供应装置供应。相关信息获取装置通过语音识别、根据从所述信号供应装置供应的音频信号产生指示了所述用于再现的声音的发音内容的字符串，并且通过所产生的字符串的机器翻译，产生指示了所述用于再现的声音的翻译的字符串，并且获取指示了所述用于再现的声音的翻译并已经通过输入装置上执行的操作而编辑了的字符串，作为所述一条相关信息。在该模式中，获取管理员对指示了通过机器翻译产生的翻译的字符串进行编辑而产生的字符串，作为相关信息。因此，优点在于，与仅通过机器翻译产生指示了用于再现的声音的翻译的字符串的模式相比，获取了更高质量的书面翻译。此外，进一步的优点在于，与仅通过人工翻译的方式获取书面翻译的情况相比，可以减少管理员所需的工作量，并且可以更快速地获取相关信息。

在本发明的优选模式中，音频信号获取装置获取指示了所述用于再现的声音的音频信号，该音频信号从信号供应装置供应。相关信息获取装置获取与从所述信号供应装置供应的音频信号有关的内容，作为所述一条相关信息。在该模式中，获取与指示了用于再现的声音的音频信号有关的内容作为相关信息。因此，可以利用简单构造向终端装置的用户导览与用于再现的声音有关的各种信息(例如，关于从用于再现的声音衍生的服务的信息)。

本发明表征为用于根据上述每个模式的信息管理系统的操作的方法(信息管理方法)。本发明还表征为使得计算机执行包括在根据上述每个模式的信息管理系统中的功能的程序并且表征为存储有所述程序的计算机可读存储介质。即，在本发明的信息管理方法的一个模式中，所述方法包括：获取表示用于再现的声音的音频信号；获取与所述用于再现的声音有关的一条相关信息；将针对所述用于再现的声音获取的所述一条相关信息与一旦发射与所述音频信号对应的所述用于再现的声音就通知给终端装置的一条识别信息相关联，并且将所述一条相关信息和所述一条识别信息存储在存储装置中；和从所述终端装置接收包括通知给所述终端装置的所述一条识别信息的信息请求，并向所述终端装置发送与所述一条识别信息相关联并存储在所述存储装置中的所述一条相关信息。在本发明的程序的一个模式中，所述程序使得计算机执行：音频信号获取处理，其获取表示用于再现的声音的音频信号；相关信息获取处理，其获取与所述用于再现的声音有关的一条相关信息；关联管理处理，其将相关信息获取处理中针对所述用于再现的声音获取的所述一条相关信息与一旦发射与所述音频信号对应的所述用于再现的声音就通知给终端装置的一条识别信息相关联；和信息提供处理，其从所述终端装置接收包括通知给所述终端装置的所述一条识别信息的信息请求，并向所述终端装置发送在所述关联管理处理中与所述一条识别信息相关联的所述一条相关信息。在根据每个模式的所述信息管理方法、所述程序或存储有所述程序的计算机可读存储介质中，可以实现与根据上述模式中的每一个的信息管理系统的有利效果相类似的有利效果。

附图说明

图1是示出根据本发明的第一实施例的通信系统的构造的示图。

图2是示出信息管理系统的构造的示图。

图3是示出音频信号获取器和相关信息获取器的构造的示图。

图4是示出信号处理器的构造的示图。

图5是示出信号处理器的操作的示图。

图6是示出信息管理系统的操作的流程图。

图7是示出声音发射系统的构造的示图。

图8是示出终端装置的构造的示图。

图9是示出获取相关信息时终端装置的操作的示图。

图10是示出音频信号获取器和相关信息获取器的修改例(模式1)的构造的示图。

图11是示出音频信号获取器和相关信息获取器的修改例(模式2)的构造的示图。

图12是示出音频信号获取器和相关信息获取器的修改例(模式3)的构造的示图。

图13是示出音频信号获取器和相关信息获取器的修改例(模式4)的构造的示图。

图14是示出音频信号获取器和相关信息获取器的修改例(模式5)的构造的示图。

图15是示出音频信号获取器和相关信息获取器的修改例(模式6)的构造的示图。

图16是示出音频信号获取器和相关信息获取器的修改例(模式7)的构造的示图。

图17是示出音频信号获取器和相关信息获取器的修改例(模式7)的进一步修改的构造的示图。

图18是示出音频信号获取器和相关信息获取器的修改例(模式7)的进一步修改的构造的示图。

图19是示出音频信号获取器和相关信息获取器的修改例(模式7)的进一步修改的构造的示图。

图20是示出音频信号获取器和相关信息获取器的修改例(模式8)的构造的示图。

图21是示出音频信号获取器和相关信息获取器的修改例(模式8)的进一步修改的构造的示图。

图22是示出音频信号获取器和相关信息获取器的修改例(模式8)的进一步修改的构造的示图。

图23是示出根据第二实施例的信号处理器的操作的示图。

图24是示出根据第三实施例的信息提供器的操作的示图。

图25示出了根据一个修改例的相关信息的显示示例。

图26是示出根据一个修改例的通信系统的构造的示图。

具体实施方式

第一实施例

图1是示出根据本发明的第一实施例的通信系统100的构造的示图。如图1的示例中所示，第一实施例的通信系统100包括信息提供系统10和终端装置12。信息提供系统10是计算机系统，其向终端装置12提供各种信息。终端装置12是便携式信息处理装置，比如移动电话或智能电话。在以下描述中，假设终端装置12的用户出现在展示比如艺术品和文献之类的展览品的比如美术馆或博物馆之类的设施(下文称作“展览设施”)M中，并且假设从信息提供系统10向终端装置12提供与各展览品有关的信息。在图1中，为了简要示出了单个终端装置12。但是，在现实中，信息提供系统10可以向多个终端装置12中的每一个提供信息。

如图1的示例中所示，第一实施例的信息提供系统10包括信息管理系统14和声音发射系统16。声音发射系统16安装在展览设施M中，用于设施中的语音导览。具体地，如图1的示例中所示，第一实施例的声音发射系统16发射特定语言(下文称作“第一语言”)的用于为用户导览的语音(下文称作“导览语音V”)，并向终端装置12通知预先分配给导览语音V的识别信息D。例如，导览语音V是提供展览品的说明的声音，或者是提供展览设施M的音频导览的声音。通过无线信息通信将导览语音V的识别信息D通知给终端装置12。在第一实施例中，描述了其中通过声音通信(其中声音(声波)，即，空气的振动，被用作传输介质)从声音发射系统16向终端装置12通知识别信息D的示例。即，识别信息D作为声音与导览语音V一起从声音发射系统16发射。

信息管理系统14是计算机系统，其管理提供至终端装置12的信息。终端装置12能够经由通信网络18(包括移动通信网络、互联网等)与信息管理系统14进行通信。如图1的示例中所示，终端装置12向信息管理系统14发送信息请求R，该信息请求R包括声音发射系统16所通知的识别信息D。信息管理系统14向请求源终端装置12发送相关信息Q，该相关信息Q与经由通信网络18接收到的信息请求R中所指定的识别信息D相对应。相关信息Q是与导览语音V有关的信息。在第一实施例中，终端装置12被提供有指示翻译的相关信息Q，在该翻译中，作为第一语言的导览语音V发音的导览已经被翻译成另一语言(下文称作“第二语言”)。因此，能够理解第一语言的用户将能够通过聆听导览语音V理解用于展览设施M的导览，而能够理解第二语言的用户将能够通过参考相关信息Q理解用于展览设施M的导览。以下提供关于以上简要描述的通信系统100的各元件的具体构造和功能的细节。

信息管理系统14

图2是示出信息管理系统14的构造的示图。如图2的示例中所示，第一实施例的信息管理系统14包括控制装置142、存储装置144、输入装置146和显示装置148。存储装置144存储由控制装置142使用的各种数据，并且还存储由控制装置142执行的程序。任何公知存储介质(例如半导体存储介质或磁存储介质)或不同类型存储介质的组合可用于存储装置144。输入装置146是操作信息管理系统14的管理员操作来向信息管理系统14提供各种指令的操作设备。输入装置146包括例如管理员可操作的操作单元。例如，通过适当地操作输入装置146，管理员可以提供关于包含展览设施M中的各展览品的导览的字符串(下文称作“指定字符串ST”)的指令。显示装置148是在控制装置142的控制下显示各种信息(比如语音识别的结果和机器翻译的结果)的装置(例如，液晶显示面板)。这里，可以采用输入装置146和显示装置148一体形成的触摸面板。

如图2的示例中所示，控制装置142可以为中央处理单元(CPU)，并且通过与存储装置144中存储的程序进行协作来实现信息管理系统14的功能。即，通过执行存储在存储装置144中的程序，控制装置142实现各种功能(音频信号获取器22、相关信息获取器24、识别信息设置器26、信号处理器32、关联管理器34和信息提供器36)以管理要提供至终端装置12的信息。可以采用其中控制装置142的各功能在多个装置中分布的构造。额外地或替代性地，可以采用使得控制装置142的部分功能由专用电子电路执行的构造。

音频信号获取器22获取表示导览语音V的音频信号SG。如图3的示例中所示，第一实施例的音频信号获取器22通过语音合成产生表示导览语音V的时间波形的音频信号SG，导览语音V是第一语言的、由管理员经由输入装置146的操作而指定的指定字符串ST的发音声。任何公知技术可用于音频信号获取器22所执行的语音合成。例如，音频信号获取器22可以通过例如单元拼接型语音合成(其通过从预先准备的语音单元(音素或音素链)中按照时间顺序对与指定字符串ST中的字符相对应的语音单元进行拼接来产生音频信号SG)或通过基于统计模型的语音合成(其通过利用统计模型(比如隐马可夫模型(HMM))产生对应于指定字符串ST的音频信号SG)来产生音频信号SG。在本实施例中，由于通过语音合成来产生指示导览语音V的音频信号SG，因此可以获得无需提前记录导览语音V的优点。

图2中的相关信息获取器24产生与导览语音V有关的相关信息Q。如图3的示例中所示，通过对第一语言的、管理员指定的指定字符串ST进行机器翻译(自动翻译),第一实施例的相关信息获取器24产生表示展览设施M的导览的第二语言的字符串(下文称作“翻译的字符串CT”)。任何公知技术可以用于对指定字符串ST进行机器翻译。相关信息获取器24可以通过利用例如基于规则的机器翻译(其中基于对指定字符串ST进行语法分析的结果和语言规则来转换词汇顺序和各词汇)或通过统计机器翻译(其中利用表示了语言的统计学趋势的统计模型(翻译模型和语言模型)来将指定字符串ST翻译为第二语言)来产生相关信息Q。在本实施例中，由于通过对指示导览语音V的发音内容的字符串进行机器翻译(即，通过对指定字符串ST进行机器翻译)来产生相关信息Q，因此，获得了无需预先准备与导览语音V的语言不同的语言的相关信息Q的优点。

图2的识别信息设置器26对将与导览语音V的再现一起从声音发射系统16通知给终端装置12的识别信息D进行分配。识别信息D包括用于识别导览语音V的唯一码，并且被分配给每个导览语音V。例如，识别信息设置器26将通过公知技术产生的一系列随机数字作为识别信息D分配给导览语音V，使得所述一系列随机数字不会与针对不同导览语音V的另一系列随机数字重叠。

信号处理器32通过将识别信息设置器26分配的识别信息D与导览语音V的音频信号SG进行合成来产生音频信号S。任何公知技术(例如，音频水印)可以用于识别信息D与音频信号SG的合成。例如，优选地使用WO 2010/016589中描述的技术。具体地，如图4的示例中所示，信号处理器32包括解调处理器322和混合处理器324。通过利用扩频码对识别信息D顺序地执行扩频调制并通过利用特定频率的载波执行频率变换，解调处理器322产生包括作为该特定频带的声音分量的识别信息D的音频信号(下文称作“调制的信号”)SD。调制的信号SD的频带是其中声音发射系统16可以发射声音并且其中终端装置12可以接收声音的频带，并且处于比正常环境中用户可听到的声音(比如语音或乐音)的频带(例如，可听频带中的16kHz或更低)更高的频带范围(例如，18kHz或更高且20kHz或更低)内。解调处理器322产生调制的信号SD的方式不限于上述示例(扩频调制)。例如，可以通过将特定频率的载波(例如正弦波)与识别信息D进行频率调制来产生指定频带(例如，18kHz或更高且20kHz或更低)中的调制的信号SD。

图4中的混合处理器324通过将音频信号获取器22获取的音频信号SG与解调处理器322产生的调制的信号SD叠加(通常是相加)来产生音频信号S。从以上描述中可以理解，音频信号S包括导览语音V的声音分量(音频信号SG)和包括导览语音V的识别信息D的声音分量(调制的信号SD)。

图5是描述导览语音V的音频信号SG与包括识别信息D的调制的信号SD之间的时间关系的示图。如图5的示例中所示，包括导览语音V的识别信息D的调制的信号SD被多次地重复添加至导览语音V的音频信号SG中的沿时间轴的不同部分。即，导览语音V的识别信息D的声音分量沿时间轴在导览语音V中的多个点处混合。这里，调制的信号SD可以按照连续方式沿时间轴彼此连接。

第一实施例的信号处理器32以特定格式(例如，WAV格式或MP3格式)将音频信号S作为音频文件存储在存储装置144中。通过重复该处理多次，对于具有不同导览内容的导览语音V(针对不同展览品来提供导览的导览语音V)中的每一个，在存储装置144中存储音频信号S，其包括：导览语音V的声音分量(音频信号SG)和包括导览语音V的识别信息D的声音分量(调制的信号SD)。

图2的关联管理器34将通过识别信息设置器26分配给每个导览语音V的识别信息D与通过相关信息获取器24针对导览语音V而获取的相关信息Q相关联，并且将识别信息D与相关信息Q存储在存储装置144中。因此，如图2的示例中所示，针对相应导览语音V的每条识别信息D，在存储装置144中存储一条相关信息Q。从以上描述中将理解到，针对展览设施M中发射的每个导览语音V，产生音频信号S和一条相关信息Q。换言之，各自对应于共同的导览语音V的音频信号SG(音频信号S)和一条相关信息Q通过对应的一条识别信息D而彼此相关联。虽然图2中示出了在存储装置144中存储各音频信号S和各条相关信息Q的示例构造，但是各音频信号S和各条相关信息Q可以存储在分离的存储介质中。替代性地，可以采用其中将连接至信息管理系统14并能够与信息管理系统14交换数据的至少一个外部装置用作存储各音频信号S和各条相关信息Q的存储装置的构造。

图2中的信息提供器36从终端装置12接收包括一条识别信息D的信息请求R，并且从存储在存储装置144中的多条相关信息Q中选择与信息请求R中指定的所述一条识别信息D相对应的一条相关信息Q，以将所选择的该条相关信息Q发送至请求源终端装置12。稍后描述向终端装置12发送相关信息Q。

图6是信息管理系统14产生音频信号S和相关信息Q的处理(下文称作“信息产生处理”)的流程图。例如，图6中示出的信息产生处理在管理员对输入装置146进行操作之后(具体地，在管理员对指定字符串ST进行指定之后)启动。在启动信息产生处理之后，控制装置142(音频信号获取器22和相关信息获取器24)获取与指定字符串ST对应的导览语音V的音频信号SG和与该导览语音V有关的相关信息Q(SA1)。控制装置142(识别信息设置器26)为导览语音V分配识别信息D(SA2)。控制装置142(信号处理器32)产生音频信号S，并且将所产生的音频信号S存储在存储装置144中(SA3)，在该音频信号S中，包括导览语音V的识别信息D的调制的信号SD叠加在导览语音V的音频信号SG上。控制装置142(关联管理器34)将针对导览语音V的相关信息Q与识别信息D相关联，并且将它们存储在存储装置144中(SA4)。

在如上作为示例描述的信息产生处理中由信息管理系统14产生的音频信号S(音频文件)被传输至图1中所示的声音发射系统16。传输音频信号S的方式可以自由选择。例如，音频信号S可以经由通信网络18从信息管理系统14传输至声音发射系统16，或者音频信号S可以经由便携式存储介质(比如半导体存储介质)从信息管理系统14传输至声音发射系统16。

声音发射系统16

图7是声音发射系统16的构造示图。如图7的示例中所示，第一实施例的声音发射系统16包括控制装置162、存储装置164和声音发射装置166。存储装置164是公知的存储介质，比如半导体存储介质或磁存储介质，或者是不同类型存储介质的组合。在存储装置164中，存储有从信息管理系统14传输的各音频信号S。

控制装置162控制声音发射系统16中的各元件。第一实施例的控制装置162为声音发射装置166提供存储装置164中存储的音频信号S。声音发射装置166各自放置在展览设施M的不同展览品中的对应一个的附近。放置在展览品附近的声音发射装置166被提供有与该展览品的导览语音V相对应的音频信号S。每个声音发射装置166是根据从控制装置162提供的音频信号S发射声音的音频装置。为了简要起见省略了将音频信号S从数字格式转换为模拟格式的D/A转换器的图示。

如上参照图4和图5所述，音频信号S包括表示导览语音V的音频信号SG和包括导览语音V的识别信息D的调制的信号SD。因此，与一个展览品相对应的声音发射装置166发射表示该展览品的导览语音V的声音。如图5的示例中所示，针对识别信息D的调制的信号SD被多次地重复添加至音频信号SG。因此，导览语音V的识别信息D的声音与导览语音V的再现相并行地多次重复发射。声音发射装置166附近(展览品附近)的用户听到针对该展览品的导览语音V，并且通过声音通信向用户的终端装置12通知导览语音V的识别信息D。如上所述，因为与用户在正常环境下能够听到的声音的频带相比，包括识别信息D的调制的信号SD的频带处于更高的音高范围(例如，18kHz或更高且20kHz或更低)，所以识别信息D的声音几乎无法被用户听到。因此，可以利用声音通信将识别信息D发送至终端装置12，而不会妨碍用户聆听导览语音V。

终端装置12

图8是示出终端装置12的构造的示图。在图8中，还示出了声音发射系统16的声音发射装置166中的一个。如图8的示例中所述，第一实施例的终端装置12包括控制装置50、存储装置52、通信装置54、声音接收装置56和输出装置58。存储装置52存储由控制装置50使用的数据，并且还存储由控制装置50执行的程序。任何公知存储介质(比如半导体存储介质或磁存储介质)或不同类型存储介质的组合可用作存储装置52。

声音接收装置56是接收环境声音的音频装置(麦克风)，并且用于终端装置12之间的语音呼叫，或者在录制视频期间用于记录声音。如图8的示例中所示，第一实施例的声音接收装置56接收从展览设施M的声音发射装置166发射的声音，并产生表示所接收的声音的时间波形的音频信号(下文称作“接收的音频信号”)X。因此，接收的音频信号X包括导览语音V的声音分量(音频信号SG)和导览语音V的识别信息D的声音分量(调制的信号SD)。为了简要起见，省略了将声音接收装置56产生的接收的音频信号X从模拟格式转换为数字格式的A/D转换器的图示。

控制装置50控制终端装置12中的各元件。例如，第一实施例的控制装置50是CPU并且通过执行存储在存储装置52中的程序来用作信息提取器51。信息提取器51通过对声音接收装置56所产生的接收的音频信号X进行解调来提取导览语音V的识别信息D。具体地，信息提取器51通过利用例如高通滤波器从接收的音频信号X中选择处于高音高范围且包括识别信息D的频带(18kHz或更高且20kHz或更低)中的频带分量。随后，信息提取器51通过使所选择的频带分量通过匹配滤波器来提取识别信息D，在该匹配滤波器中使用在识别信息D的扩频调制时使用的扩频码作为系数。

通信装置54是经由通信网络18与信息提供系统10进行通信的通信设备。可以任意选择通信装置54和通信网络18之间的通信方案。通常，使用与声音发射装置16向终端装置12通知识别信息D所使用的声音通信不同的无线通信方案(例如，利用无线电波或红外线作为传输介质的信息通信)。如图8的示例中所示，第一实施例的通信装置54包括发射器542和获取器544。发射器542向信息管理系统14发送信息请求R，该信息请求R包括信息提取器51从接收的音频信号X中提取的识别信息D。获取器544获取响应于信息请求R而从信息管理系统14发送的相关信息Q。如上参照图5所述的那样，识别信息D的调制的信号SD被多次地重复添加至导览语音V的音频信号SG。因此，虽然对于信息提取器51而言可以在多个时间点处多次重复地每次提取单条识别信息D，但是只有在信息提取器51首次提取新的识别信息D时才执行信息请求R的发送和相应的相关信息Q的接收。如上述示例中所述，在第一实施例中，重复多次地发送单条识别信息D。因此，可以获得这样的优点：例如，即使由于周围噪声干扰而导致终端装置12获取识别信息D失败，终端装置12也能够再次获取识别信息D。

图8的输出装置58输出获取器544从信息管理系统14获取到的相关信息Q。在第一实施例中，采用以第二语言显示相关信息Q所指示的翻译的字符串CT的显示装置作为输出装置58。即，并行于通过声音发射系统16的声音发射装置166进行的第一语言的导览语音V的再现，在终端装置12上显示(呈现)第二语言的翻译的字符串CT。因此，即使终端装置12的用户无法理解第一语言，该用户通过查看第二语言的翻译的字符串CT也将能够理解关于展览品的导览。

图9是示出终端装置12的用于获取相关信息Q的操作的示图。如上所述，从声音发射系统16的声音发射装置166的每一个处，与导览语音V的再现并行地重复发射识别信息D的声音。当终端装置12的用户移动到从声音发射装置166发射的声音的范围内时，即，当移动到靠近展览品时，终端装置12的声音接收装置56产生接收的音频信号X，其包括导览语音V的声音分量和相应一条识别信息D的声音分量(SB1)。控制装置50(信息提取器51)通过对接收的音频信号X进行解调来提取该条识别信息D(SB2)，并且通信装置54的发射器542向信息管理系统14发送包括该条识别信息D的信息请求R(SB3)。

信息管理系统14的信息提供器36从通信网络18接收终端装置12所发送的信息请求R。随后，信息提供器36从存储在存储装置144中的多条相关信息Q中选择与信息请求R中指定的那条识别信息D相对应的那条相关信息Q(SB4)，并且将所选择的这条相关信息Q发送至请求源终端装置12(SB5)。终端装置12的获取器544从信息管理系统14获取该条相关信息Q(SB6)，并且输出装置58输出该条相关信息Q(SB7)。从以上描述中可以理解，在终端装置12并行于导览语音的再现而接收从声音发射系统16的声音发射装置166发射的识别信息D的声音之后，即，在终端装置12在来自声音发射装置166的声波到达终端装置12的范围内移动之后，执行包括识别信息D的信息请求R的发送(SB3)和与识别信息D对应的相关信息Q的获取(SB6)。

如上所述，在第一实施例中，发射对应于音频信号S的声音，音频信号S包括导览语音的音频信号SG和包括导览语音的识别信息D的调制的信号SD。即，通过利用了与导览语音一起发射的声音的声音通信来向终端装置12通知识别信息D。因此，获得了这样的优点：用于语音呼叫和记录声音的声音接收装置56可以被用于获取识别信息D，因此，无需专用于识别信息D的无线通信的通信设备。此外，获得了这样的优点：在声音发射系统16中，无需专用于识别信息D的发送的通信设备，并且用于语音导览的现有声音发射装置166可以被用于向终端装置12通知识别信息D。此外，根据其中通过声音通信来向终端装置12传达识别信息D的构造，优点在于可以毫无困难地控制识别信息D的声音的到达范围，并且可以向多个终端装置12统一通知识别信息D。

在第一实施例中，通过信息管理系统14将一旦发射导览语音V就向终端装置12通知的一条识别信息D和与该导览语音V有关的一条相关信息Q彼此关联，并且在多条相关信息Q中，将与通知给终端装置12的该条识别信息D相对应的该条相关信息Q提供给终端装置12。因此，终端装置12的存储装置52无需预先存储多条相关信息Q。根据上述构造，与专利文献1和2中的技术相比，获得了终端装置12存储相关信息Q所需的存储容量可以极大减小的优点。在每个终端装置12中存储了多条相关信息Q的构造中，当一条相关信息Q需要更新时，该条相关信息Q需要分别在每个终端装置12中更新。在第一实施例中，多条相关信息Q存储在信息管理系统15的存储装置144中并被选择性地提供给终端装置12。因此，通过更新存储在存储装置144中的相关信息Q，可以向每个终端装置12提供更新后的相关信息Q。因此，获得了无需针对每个终端装置12分别更新相关信息Q的优点。

在第一实施例中，导览语音V的识别信息D被与该导览语音的再现一起通知给终端装置12。因此，与识别信息D相对应的相关信息Q可以并行于导览语音V的再现而在终端装置1上输出。例如，与在导览语音的再现之后输出相关信息Q的构造相比，可以获得用户能够容易地辨识导览语音V和相关信息Q之间的关联性的优点。

例如，日本专利申请公开第2011-109629号(下文称作“现有技术1”)公开了一种自动再现语音导览系统，其利用放置在美术馆或博物馆中的展览品附近的发送装置和用户携带的便携式接收器。发送装置通过无线电波或红外线间歇性地将展览品唯一的识别码发送到其周围环境。便携式接收器从预先存储在其存储介质中的各导览语音中再现与从发送装置接收的识别码相对应的导览语音。根据现有技术1，在便携式接收器在(展览品附近的)一个范围(在该范围中来自发送装置的无线电波或红外线到达便携式接收器)内移动并接收到识别码之后，对描述该范围内的展览品的导览语音进行再现。

但是，在现有技术1中，因为通过无线电波或红外线来发送每个展览品的识别码，因此需要将发送或接收无线电波或红外线的专用通信设备附加至每个发送装置和每个便携式接收器。在第一实施例中，发射对应于音频信号S的声音，音频信号S包括导览语音V的音频信号SG和包括导览语音V的识别信息D的调制的信号SD。即，通过利用了与导览语音V一起发射的声音的声音通信来向终端装置12通知识别信息D。因此，获得了这样的优点：用于语音呼叫和记录声音的声音接收装置56可以被用于获取识别信息D，因此，无需专用于识别信息D的无线通信的通信设备。此外，获得了这样的优点：在声音发射系统16中，无需专用于识别信息D的发送的通信设备，并且用于语音导览的现有声音发射装置166可以被用于向终端装置12通知识别信息D。换言之，可以通过利用发射和接收声音的部件、通过简单构造来发射和接收识别信息D。此外，根据通过声音通信来向终端装置12传达识别信息D的构造，优点在于可以毫无困难地控制识别信息D的声音的到达范围，并且可以向多个终端装置12统一通知识别信息D。

例如，日本专利申请公开第2000-207170号(下文称作“现有技术2”)公开了一种信息处理装置，其以不会干扰对与将要再现的音频信号对应的声音的聆听的方式，向该音频信号添加附加信息，以产生输出音频信号。在利用该信息处理装置的播报系统(announcement system)中，当经由扬声器向用户发送作为语音导览的信息时，服务器向该信息添加与该语音导览有关的信息(例如，翻译)作为附加信息。例如，通过扩频技术，将附加信息叠加到音频信号上。

在上述使用声波(其为空气的振动)作为传输介质的声音通信中，发送速度和发送容量与使用例如无线电波作为传输介质的无线通信相比而言较低。在现有技术2中，通过声音通信发送附加信息(即，相关信息)。在第一实施例中，通过声音通信发送识别信息D。因此，第一实施例的构造具有这样的优点：通过声音通信发送的数据量减小，这是因为发送了其数据大小比相关信息更小的识别信息D。由于声音通信中通信容量较小，因此采用现有技术2方案可以发送的附加信息实际上限于具有小的数据大小的信息。在第一实施例中，通过声音通信发送识别信息，并且通过信息管理系统14分发与该识别信息相对应的相关信息。因此，还可以向用户呈现具有大的数据大小的各种相关信息(例如，声音或图像)。

第一实施例的各修改例

在第一实施例中，利用由信息管理系统14的管理员指定的指定字符串ST、通过语音合成来产生音频信号SG，并且通过对指定字符串ST进行机器翻译来产生相关信息Q。获取(通常地，产生)音频信号SG和相关信息Q的方式不限于这些示例。下面描述获取音频信号SG和相关信息Q的其他方式的示例。关于以下描述的每种模式中获取音频信号SG和相关信息Q的处理，可以视情况改变执行用以获取(或产生)音频信号SG的处理和用于获取(或产生)相关信息Q的处理的顺序。

修改模式1

在图10的示例中示出的模式1中，信息管理系统14的音频信号获取器22以与第一实施例中采用的方式类似的方式，根据指定字符串ST、通过语音合成来产生导览语音V的音频信号SG。相关信息获取器24获取管理员指定的指定字符串ST作为相关信息Q。即，相关信息Q是表示第一语言的导览语音V的发音内容的字符串，第一语音还用于导览语音V。在上述构造中，并行于由声音发射系统16进行的导览语音V的再现，在显示装置12上显示导览语音V的发音内容的字符串。因此，获得了例如弱听力人士(听力障碍人士)能够查看导览语音V的内容的优点。

在根据本实施例的该模式的信息产生处理(图6)中，可以理解，获取与指定字符串ST对应的导览语音V的音频信号SG和与该导览语音V有关的相关信息Q的步骤(SA1)包括：通过语音合成产生与指定字符串ST对应的导览语音V的音频信号SG；以及获取指定字符串ST作为相关信息Q。

修改模式2

在图11的示例中示出的模式2中，信息管理系统14的音频信号获取器22以与第一实施例中采用的方式类似的方式，根据第一语言的指定字符串ST、通过语音合成来产生导览语音V的音频信号SG。信息管理系统14的管理员通过适当地操作输入装置146来指定第二语言的表示导览语音V的字符串(翻译的字符串CT)。相关信息获取器24获取第二语言的、由管理员指定的翻译的字符串CT作为相关信息Q。在如上参照的图3中示出的构造中，当机器翻译准确性较低时无法产生适当的翻译的字符串CT。在图11的示例中示出的模式2中，对指定字符串ST的机器翻译(图3)是不必需的。因此，获得了这样的优点：可以准备例如通过人工翻译(人类翻译)产生且准确地以第二语言表示导览语音V的相关信息Q。

在该模式中，可以理解，信息产生处理(图6)的步骤SA1包括：通过语音合成产生与指定字符串ST对应的导览语音V的音频信号SG；和获取指定的翻译的字符串CT(即，获取根据从导览语音V的发音内容到第二语言的翻译导出的字符串)作为相关信息Q。

修改模式3

在图12的示例中示出的模式3中，信息管理系统14的音频信号获取器22以与第一实施例中采用的方式类似的方式，根据指定字符串ST、通过语音合成来产生导览语音V的音频信号SG。相关信息获取器24通过对第一语言的指定字符串ST进行机器翻译来产生第二语言的翻译的字符串CT，并且根据翻译的字符串CT、通过语音合成产生第二语言的导览语音V的音频信号作为相关信息Q。终端装置12的输出装置58包括声音发射装置(比如扬声器或耳机)，其用于发射与从信息管理系统14提供的相关信息Q所指示的音频信号相对应的声音(第二语言的导览语音V)。即，并行于声音发射系统16进行的第一语言的导览语音V的再现，通过终端装置12再现第二语言的导览语音。因此，即使当终端装置12的用户无法理解第一语言时，该用户通过聆听第二语言的导览语音V也将能够理解关于展览品的导览。

在该模式中，可以理解，信息产生处理(图6)的步骤SA1包括：通过语音合成产生与指定字符串ST对应的导览语音V的音频信号SG；通过对所指定的指定字符串ST进行机器翻译(即，对表示导览语音V的发音内容的字符串进行机器翻译)来产生表示导览语音V的翻译的翻译的字符串CT；和通过语音合成产生作为翻译的字符串CT的发音声且指示导览语音V的音频信号(即，产生指示口声(vocal sound)的音频信号，所述口声是根据从导览语音V的发音内容到第二语言的翻译导出的字符串的发音声)。

修改模式4

在图13的示例中示出的模式4中，信息管理系统14的音频信号获取器22从信号供应装置200获取导览语音V的音频信号SG。信号供应装置200可以为接收其附近声音并产生音频信号SG的声音接收装置；或者其可以为从便携式存储介质或内置存储介质获取音频信号SG并输出该信号的再现装置；或者其可以为从通信网络18接收音频信号SG并输出该信号的通信装置。相关信息获取器24获取管理员指定的指定字符串ST作为相关信息Q，如在上述模式1或模式2中那样。因此，声音发射装置166发射与信号供应装置200所产生的音频信号SG相对应的导览语音V，并且在终端装置12上显示符合来自管理员的指令的指定字符串ST。相关信息获取器24可以从声音供应装置200获取音频信号(例如，第二语言的导览语音V的音频信号)作为相关信息Q。

在该模式中，可以理解，信息产生处理(图6)的步骤SA1包括：从信号供应装置200获取导览语音V的音频信号SG；以及获取所指定的指定字符串ST(即，获取表示导览语音V的发音内容的字符串)作为相关信息Q。

修改模式5

在图14的示例中所示的模式5中，信息管理系统14的音频信号获取器22以与第一实施例中采用的方式类似的方式，根据指定字符串ST、通过语音合成来产生导览语音V的音频信号SG。相关信息获取器24获取与导览语音V有关的图像IMG(静态或动态)作为相关信息Q。因此，并行于与指定字符串ST对应的第一语言导览语音V的再现，在终端装置12上与显示导览语音V有关的图像IMG。在该模式中，因为获取与导览语音V有关的图像IMG作为相关信息Q，因此具有无需在终端装置12中预先存储图像IMG的优点。当在终端装置12中存储具有大的数据大小的图像数据时，占用了终端装置12的大量存储容量。根据本模式，可以极大地减小终端装置12存储与导览语音V有关的图像IMG所需的存储容量。

在该模式中，可以理解，信息产生处理(图6)的步骤SA1包括：通过语音合成产生与指定字符串ST对应的导览语音V的音频信号SG；以及获取与导览语音V有关的图像IMG作为相关信息Q。

修改模式6

在图15的示例中示出的模式6中，与图13中示出的模式(模式4)类似，信息管理系统14的音频信号获取器22从信号供应装置200获取导览语音V的音频信号SG。相关信息获取器24通过对从信号供应装置200提供的音频信号SG进行语音识别来产生表示导览语音V的发音内容的字符串作为相关信息Q。对于对音频信号SG进行的语音识别，可以使用任何公知技术，比如利用诸如HMM之类的音频模型或表示语言约束的语言模型的识别技术。从上述描述中将理解，在模式6中，并行于通过声音发射系统16进行的导览语音V的再现，在终端装置12上显示导览语音V的发音内容的字符串，如上述模式1(图10)中那样。因此，获得了这样的优点：即使在用户使用未配备有单独获取和存储表示导览语音V的发音内容的字符串的装置的终端装置12时、在错过所发射的导览语音V时或者在用户具有收听导览语音V的困难(即，弱听力人士)的情况下，用户也能够查看导览语音V的内容。终端装置12用于存储表示导览语音V的发音内容的字符串所需的存储容量减小。信息管理系统14的相关信息获取器24根据从信号供应装置200供应的指示导览语音V的音频信号SG、通过语音识别来产生表示导览语音V的发音内容的字符串。因此，获得了这样的优点：信息管理系统14无需管理员来单独指定这些字符串作为指定字符串ST。

在该模式中，可以理解，信息产生处理(图6)的步骤SA1包括：获取导览语音V的音频信号SG，该音频信号SG供应自信号供应装置200；以及通过对供应自信号供应装置200的音频信号SG进行语音识别来产生表示导览语音V的发音内容的字符串作为相关信息Q。

修改模式7

在图16的示例中示出的模式7中，信息管理系统14的音频信号获取器22以与模式6中采用的方式类似的方式，从信号供应装置200获取第一语言的导览语音V的音频信号SG。与模式6一样，相关信息获取器24通过对音频信号SG进行语音识别产生导览语音V的字符串，并且通过对该字符串进行机器翻译来产生第二语言的表示导览语音V的翻译的字符串CT作为相关信息Q。可以使用任何公知技术来进行机器翻译。换言之，在模式7中，并行于通过声音发射系统进行的第一语言的导览语音V的再现，在终端装置12上显示翻译的字符串CT，其展示了导览语音V的第二语言翻译。因此，无需管理员在信息管理系统14中单独指定该字符串作为指定字符串CT，此外，通过对表示导览语音V的发音内容的字符串进行机器翻译来产生相关信息Q。因此，获得了这样的优点：无需预先准备与导览语音V的语言不同的语言的相关信息Q。

在该模式中，可以理解，信息产生处理(图6)的步骤SA1包括：获取导览语音V的音频信号SG，音频信号SG供应自信号供应装置200；通过对供应自信号供应装置200的音频信号SG进行语音识别来产生表示导览语音V的发音内容的字符串；以及通过对所产生的字符串进行机器翻译来产生表示导览语音V的翻译的相关信息Q(即，产生根据从导览语音V的发音内容到第二语言的翻译导出的字符串作为相关信息Q)。

如图17的示例中所示，可以根据通过机器翻译产生的翻译的字符串CT、通过语音合成来产生第二语言导览语音V的音频信号作为相关信息Q。并行于导览语音V的发射，在终端装置12上再现第二语言导览语音V，第二语言不同于作为导览语音V的原始语言的第一语言。因此，获得了这样的优点：即使在终端装置12的用户无法理解第一语言的导览语音V时，用户通过聆听第二语言的导览语音V也能够理解再现内容。

在这种情况下，可以理解，图6的步骤SA1包括：获取导览语音V的音频信号SG，音频信号SG供应自信号供应装置200；通过对供应自信号供应装置200的音频信号SG进行语音识别来产生表示导览语音V的发音内容的字符串；通过对所产生的字符串进行机器翻译来产生表示导览语音V的翻译的翻译的字符串CT；以及通过语音合成产生表示作为翻译的字符串CT的发音声的口声的音频信号。

在一个构造(即，图18所示的示例构造)中，当在显示装置148上查看通过对音频信号SG进行语音识别而产生的第一语言字符串之后，管理员OP通过适当地操作输入装置146给出与导览语音V的书面的第二语言翻译有关的指令(即，示出由管理员OP他自己/她自己进行的翻译的字符串)，相关信息获取器24获取管理员指定的第二语言的翻译的字符串CT作为相关信息Q。在该模式中，相关信息获取器24获取表示管理员OP执行对第一语言字符串的人工翻译的结果的翻译的字符串CT作为相关信息Q。因此，与通过机器翻译产生翻译的字符串CT的情况相比，可以获取导览语音V的书面的第二语言翻译，该翻译具有更高的质量。

在该情况下，可以理解，图6中的步骤SA1包括：获取导览语音V的音频信号SG，音频信号SG供应自信号供应装置200；以及获取表示导览语音V的翻译的字符串作为相关信息Q，该字符串通过在输入装置146上针对表示导览语音V的发音内容的字符串执行操作而指定，并且该字符串通过对供应自信号供应装置200的音频信号进行语音识别而产生(即，获取根据从导览语音V的发音内容到第二语言的翻译导出的字符串)。

如图19的示例中所示，在如图16的模式7中那样通过机器翻译产生第二语言的翻译的字符串CT显示在显示装置148上之后，相关信息获取器24可以获取管理员OP通过操作输入装置146对翻译的字符串CT进行编辑(通常地，修订)的结果作为相关信息Q。在该模式中，获取管理员OP对通过机器翻译产生的第二语言的翻译的字符串CT进行编辑而产生的内容作为相关信息Q。因此，获得了这样的优点：与仅通过机器翻译来产生表示导览语音V的翻译的字符串的模式相比，可以获取更高质量的书面翻译。还具有这样的优点：与获取通过仅人工翻译的书面翻译的情况相比，可以减少管理员OP所需的工作量并且可以更快地获取相关信息Q。

在该情况下，可以理解，图6中的步骤SA1包括：获取导览语音V的音频信号SG，音频信号SG供应自信号供应装置200；产生表示导览语音V的发音内容的字符串，该导览语音V的发音内容通过对供应自信号供应装置200的音频信号SG进行语音识别而产生；通过对所产生的字符串进行机器翻译来产生表示导览语音V的翻译的翻译的字符串CT；以及获取表示导览语音V的翻译的字符串作为相关信息Q，该字符串已经通过对输入装置146进行操作而被编辑(即，获取根据从导览语音V的发音内容到第二语言的翻译导出的字符串)。

因此，根据从导览语音V的发音内容到第二语言的翻译导出的字符串被理解为包括例如：所指定的翻译的字符串CT(模式2(图11))；通过机器翻译产生的翻译的字符串CT(模式3(图12、图16和图17))；通过人工翻译产生的翻译的字符串(模式7(图18))；以及对通过机器翻译产生的翻译的字符串CT进行编辑而产生的字符串，所述编辑通过对输入装置146执行操作来进行(模式7(图19))。

修改模式8

在图20的示例中所示的模式8中，信息管理系统14的相关信息获取器24通过对音频信号SG进行自动内容识别(ACR)来获取与音频信号SG有关的内容或内容信息(例如，内容的名称)作为相关信息Q。可以随意使用任何适当技术来进行自动内容识别。例如，相关信息获取器24分析音频信号SG的特征(例如，MFCC、基频等)，并且从预先准备的内容中搜索和获取与音频信号SG的特征相对应的内容作为相关信息Q。对音频信号SG的特征进行分析和核对的指纹技术或将信息嵌入音频信号SG的可听频带或非可听频带中的水印技术可以应用至图20中的自动内容识别。在该模式中，由于使用自动内容识别来获取相关信息Q，因此通过简单构造，终端装置12的用户可以被导向与导览语音V有关的各种信息(例如，与从导览语音V衍生的服务有关的信息)。

在该模式的信息产生处理(图6)中，步骤SA1被理解为包括：获取导览语音V的音频信号SG，音频信号SG供应自信号供应装置200；以及获取与供应自信号供应装置200的音频信号SG有关的内容作为相关信息Q。

相关信息获取器24可以选择性地执行语音识别和自动内容识别以获取相关信息Q(图21)。例如，根据音频信号SG所表示的导览语音V的类型来选择语音识别或自动内容识别。具体地，当音频信号SG的声音是人类发出的口声(语音)时，相关信息获取器24通过对音频信号SG进行语音识别来产生相关信息Q。当音频信号SG的声音是音乐(例如，歌声、演奏乐器的声音等)时，相关信息获取器24通过对音频信号SG进行自动内容识别来获取相关信息Q。相关信息获取器24可以同时使用语音识别和自动内容识别(图22)。例如，设想这样一种构造：相关信息获取器24通过对根据对音频信号SG的语音识别产生的字符串进行自动内容识别来获取相关信息Q；或者，相关信息获取器24获取对自动内容识别所识别的内容进行语音识别而产生的字符串作为相关信息Q。

在模式6至模式8中，在使用声音接收装置(其接收从声源(例如，扬声器)发射的导览语音V以产生音频信号SG)或通信装置(其从通信网络18接收通过声音接收装置产生的音频信号SG)作为信号供应装置200的构造中，可以与声源发射导览语音V并行地且与声音发射系统16再现导览语音V并行地向终端装置12实时地提供相关信息Q。在模式6至模式8中，假设了从信号供应装置200供应音频信号SG。但是，可以通过各种语音合成技术中的任一技术来产生导览语音V的音频信号SG，并且可以通过对这些音频信号SG进行语音识别来产生相关信息Q。

其他修改

音频信号获取器22获取音频信号SG的方式以及相关信息获取器24获取相关信息Q的方式不限于上述示例。例如，通过对第一语言的指定字符串ST进行机器翻译，相关信息获取器24可以产生第二语言的翻译的字符串CT作为相关信息Q。通过根据机器翻译所产生的翻译的字符串CT进行语音合成，音频信号获取器22可以产生第二语言的导览语音V的音频信号SG。

如从上述示例中将理解的，音频信号获取器22被理解为获取导览语音V的音频信号SG的元件。音频信号获取器22的构思包括：通过音频处理(比如语音合成)产生音频信号SG的元件，以及从外部装置(比如图13中的信号供应装置200)获取音频信号SG的元件。类似地，相关信息获取器24被理解为获取与导览语音V有关的相关信息Q的元件。相关信息获取器24的构思包括：通过信息处理(比如语音识别、机器翻译、或语音合成、或这些处理中的至少两项的组合)产生相关信息Q的元件；从外部装置获取相关信息Q(比如字符串(指定字符串ST或翻译的字符串CT)或与导览语音V有关的图像)的元件；或者这两种元件的组合。

第二实施例

现在将如下描述本发明的第二实施例。在以下作为示例描述的模式的每一个中，对于其操作或功能类似于第一实施例的那些元件的元件，使用与第一实施例中相同的参考标记，并且视情况省略其详细描述。

图23是描述第二实施例中的信息管理系统14的信号处理器32中的产生音频信号S的处理的示图。如图23的示例中所示，沿时间轴具有不同位置的各部分T(下文称作“再现部分”)被分配给音频信号获取器22所获取的导览语音V的音频信号SG。具体地，根据导览语音V的内容(其目的或目标)将音频信号SG划分为各再现部分T(T1、T2等)。例如，当导览语音V包括具有要对其提供导览的不同目标的场景时，根据场景将音频信号SG划分为各再现部分T。通常根据管理员对输入装置146执行的操作来指定再现部分T的起点和终点(相邻的再现部分T之间的边界)。替代性地或额外地，音频信号S中的静音部分可以用作对再现部分T进行限定的边界。可以随意设置沿时间轴的相邻部分之间的间隔。虽然在图23中为了描述目的各再现部分T的时间长度相等，但是各再现部分T的时间长度可以彼此不同。

第二实施例的识别信息设置器26将不同的多条识别信息D(D1、D2等)分配给音频信号SG的各再现部分T。信号处理器32将识别信息设置器26分配的不同的多条识别信息D添加至音频信号SG的各再现部分T。换言之，如图23的示例中所示，信号处理器32通过重复地向音频信号SG的每个再现部分T添加识别信息设置器26已分配给该再现部分T的那条识别信息D的调制的信号SD来产生音频信号S。即，在导览语音V的再现部分T的多个时间点处，该再现部分T的一条识别信息D的声音分量被重复地混合。与第一实施例一样，通过信号处理器32产生的音频信号S被传输至声音发射系统16。

第二实施例的相关信息获取器24针对音频信号SG的每个再现部分T获取一条相关信息Q。例如，相关信息获取器24通过根据导览语音V的再现部分T对指定字符串ST进行划分并且针对每个再现部分T执行机器翻译，来针对每个再现部分产生表示第二语言的翻译的字符串CT的一条相关信息Q。关联管理器34针对导览语音V的每个再现部分T将识别信息设置器26分配的一条识别信息D与相关信息获取器24获取的那条相关信息Q相关联。即，关联管理器34将识别信息设置器26针对每个再现部分T分配的一条识别信息D与相关信息获取器24针对该再现部分T获取的一条相关信息Q相关联，并将它们存储在存储装置144中。

与第一实施例一样，声音发射系统16的声音发射装置166发射与从信息管理系统14传输的音频信号S相对应的声音。并行于与音频信号SG对应的导览语音V的再现，重复地发射针对音频信号SG的每个再现部分T的一条识别信息D的声音，各再现部分T之间的各条识别信息D彼此不同。因此，每当导览语音V的再现点从一个再现部分T改变为下一再现部分T时，就改变向终端装置12通知的那条识别信息D。终端装置12的信息提取器51从接收的音频信号X中顺序地提取导览语音V的各再现部分T的各条识别信息D。对于(针对每个再现部分T的)一条相关信息D的每次提取，通过发射器542发射指定该条相关信息D的信息请求R，并通过获取器544获取与信息请求R相对应的一条相关信息Q。因此，输出装置58输出的各条相关信息Q随着导览语音V的再现进程而顺序地改变。具体地，在导览语音V的一个再现部分T已经开始之后(在从一个再现部分T过渡到下一个再现部分T之后)，通过输出装置58输出的内容(一条相关信息Q)改变。

第二实施例实现了与第一实施例的有利效果相类似的有利效果。在第二实施例中，对于作为导览语音V的时间轴分开部分的各再现部分T的每一个，分配一条识别信息D并且该条识别信息D与相应一条相关信息Q彼此关联。因此，可以结合导览语音V的再现进程改变呈现给终端装置12的用户的相关信息Q。

第三实施例

图24是描述本发明的第三实施例中的操作的示图。如图24的示例中所示，第三实施例的信息管理系统14的存储装置144针对音频信号SG所表示的导览语音V的每条识别信息D存储多(N)条相关信息Q(Q1、Q2等)。具体地，N条相关信息Q均与导览语音V的一条识别信息D相关联并且对N条相关信息Q进行存储，该N条相关信息Q以除第一语言外的不同语言表示各自均表示最初为第一语言的导览语音V的字符串的发音声的口声。准备不同语言的N条相关信息Q的方式可以随意选择。比如，如上参照的图12的示例中那样，可以首先通过对第一语言的指定字符串ST进行机器翻译来产生不同语言的N条翻译的字符串CT。利用根据所产生的翻译的字符串CT的语音合成，随后可以产生N种语言的表示导览语音V的N条相关信息Q。替代性地，如上参照的图17的示例中那样，可以通过对导览语音V的音频信号SG进行语音识别来产生导览语音V的字符串，音频信号SG从信号供应装置200提供。随后，通过对所产生的字符串进行机器翻译，可以产生不同语言的N条翻译的字符串CT。利用根据所产生的翻译的字符串CT的语音合成，随后可以产生N种语言的表示导览语音V的N条相关信息Q

在信息提取器51从接收的音频信号X(其根据通过声音发射系统16发射并随后被接收的声音导出)中提取了识别信息D之后，终端装置12的发射器542向信息管理系统14发送包括识别信息D和语言信息L的信息请求R(SB3)。语言信息L是指定终端装置12中使用的语言的信息。可以随意选择获取语言信息L的方式。例如，可以使用发射器542通过参照终端装置12的操作系统(OS)中的语言设定来产生语言信息L的构造。在这种情况下，获得了用户无需指定语言的优点。替代性地，可以使用产生表示终端装置12的用户按照他/她的意愿指定的语言的语言信息L的构造。

在从终端装置12接收到信息请求R之后，信息管理系统14的信息提供器36从各自与信息请求R中指定的一条识别信息D相关联并且存储在存储装置144中的N条相关信息Q中，选择信息请求R中指定的语言信息L所指示的语言的一条相关信息Q(SB4)，并且将该条相关信息Q发送至请求源终端装置12(SB5)。终端装置12的获取器544获取信息管理系统14所发送的该条相关信息Q(SB6)，并且输出装置58(声音发射装置166)发射该条相关信息Q所指示的导览语音V以呈现给用户(SB7)。从以上描述中可以理解，并行于第一语言的导览语音V的再现，从终端装置12的输出装置58输出语言信息L所指定的语言的导览语音V，指定的语言为N种语言之一且不同于第一语言。因此，例如，与在导览语音V的再现之后输出相关信息Q的构造相比，获得了用户易于辨别导览语音V与相关信息Q之间的关联性的优点。

第三实施例实现了与第一实施例的那些有利效果相类似的有利效果。此外，在第三实施例中，由于将不同语言的N条相关信息Q中的一条选择性地提供给终端装置12，获得了可以向使用他们各自语言的各种用户中的每一个提供该用户可理解的语言的一条相关信息Q的优点。在以上描述中，给出了各条相关信息Q表示不同语言的语音的示例。替代性地，可以使用各条相关信息Q表示字符串(翻译的字符串CT)(其因而表示不同语言的导览语音V)的构造。在这种情况下，可以随意选择产生各条相关信息Q的方式。如图16中示出的示例中那样，可以通过对第一语言的字符串进行机器翻译产生N种不同语言的N条翻译的字符串作为N条相关信息Q，所述字符串通过对供应自信号供应装置的导览语音V的音频信号SG进行语音识别而产生。在相关信息Q表示字符串的构造中，终端装置12的输出装置58(显示装置)显示该字符串，从而将相关信息Q呈现给用户。在这种情况下，不同于图16中的示例所示的产生方法，可以使用图11(用于获取输入的翻译的字符串CT的构造)、图18(用于获取指示通过管理员OP他自己/她自己执行的翻译的字符串的构造)、或图19(用于获取根据管理员OP编辑机器翻译所产生的翻译的字符串CT而产生的字符串的构造)中所示的产生(获取)方法。第二实施例的构造可以应用至第三实施例。

修改例

以上作为示例给出的模式中的每一个可以用各种方式进行修改。下面描述一些示例修改例。可以视情况组合从以下示例中随意选择的至少两种模式，只要它们彼此不会冲突即可。

(1)在上述模式中，示出了一种构造的示例，其中每当接收一条识别信息D的声音时(每当用户移动到展览品附近时)，终端装置12就获取与该条识别信息D相对应的一条相关信息Q。替代性地，关联管理器34可以将与展览设施M中的不同展览品对应的多条相关信息Q与仅一条识别信息D相关联，并且当终端装置12接收到从声音发射系统16的声音发射装置166发射的该条识别信息D的声音时，终端装置12可以从信息提供器36统一地获取与该条识别信息D相对应的所述多条相关信息Q。例如，当终端装置12的用户进入特定展览设施M时或者当用户在展览设施M中首次获取到一条识别信息D时，终端装置12可以统一地获取与展览设施M中的各展览品有关的多条相关信息Q。

在专利文献1和2的技术中，选择性地再现在用户携带的终端装置(专利文献1中的再现单元或专利文献2中的便携式收发装置)中预先存储的多条相关信息。因此，存在这样的问题：当需要更新信息时，需要在每个终端装置中分别更新信息。在根据修改例的当前模式的构造中，向终端装置12提供信息管理系统14的存储装置144中存储的相关信息Q。因此，通过更新存储在存储装置144中的相关信息Q，可以将更新后的相关信息Q提供给每个终端装置12。因此，获得了无需针对每个终端装置12分别更新相关信息Q的优点。

(2)相关信息Q的内容不限于上述模式中示出的示例。例如，信息提供器36可以向终端装置12提供声音、图像和字符串(它们被示出为上述模式中的相关信息Q的示例)之中的至少两者的组合，作为相关信息Q。替代性地或额外地，例如，信息提供器36可以向终端装置12提供指示与导览语音V有关的信息(例如，上述示例中示出的相关信息Q)的位置的链接信息(例如，URL)，作为相关信息Q。

(3)在第二实施例中，如参照图23描述的那样，示出了其中与导览语音V的不同再现部分T相对应的多条识别信息D(D1、D2、D3等)中的每一条在相应再现部分T中重复地多次发送至终端装置12的示例构造。在该构造中，例如，在终端装置12获取到在接近再现部分T1的结尾的点处发送的识别信息D1和在接近下一再现部分T1的开头的点处发送的识别信息D2的情况下，存在终端装置12将在与识别信息D1对应的相关信息Q被再现的中途获取到与识别信息D2对应的相关信息Q的可能性。在这种情形下，优选的是，终端装置12中途(获取到与识别信息D2对应的相关信息Q的点处)停止再现与识别信息D1对应的相关信息Q，并且随后开始再现与识别信息D2对应的相关信息Q。替代性地，可以仅在相应再现部分T的开头(即，上半段)期间向终端装置12发送各条识别信息D，以使得在与不同的各条识别信息D对应的多条相关信息Q之间，通过终端装置12进行的所述多条相关信息Q的再现的时间段不会彼此重叠。

在如上述示例中那样终端装置12在再现与识别信息D1对应的相关信息Q的中途获取到识别信息D2的相关信息Q的情况下，可以使用这样的构造：终端装置12在完成识别信息D1的相关信息Q的再现之后开始再现识别信息D2的相关信息Q。替代性地，在终端装置12在再现与识别信息D1对应的相关信息Q的中途获取到识别信息D2的相关信息Q的情况下，用户所执行的操作可以作为触发器以使得终端装置12开始再现识别信息D2的相关信息Q，从而使得识别信息D1的相关信息的再现在中途停止。例如，在获取到与识别信息D2对应的相关信息Q之后显示“下一个”按钮，并且在用户操作该按钮之后，终端装置12开始再现识别信息D2的相关信息Q。

(4)可以随意选择输出(例如，显示)相关信息Q的方式。例如，在终端装置12包括例如获取图像(静态和/或动态)的图像获取装置(图中未示出)的构造中，可以对图像获取装置获取的图像和相关信息Q所指示的图像(例如，静态图像、动态图像、字符串等)进行合成并将其显示在输出装置58的显示装置上。

例如，如图25所示，设想了这样的情况：在诸如博物馆之类的展览设施M中展示机器人300作为展览品，机器人300带有发射各种用于再现的声音(比如导览语音)的声音发射功能。信息管理系统14的存储装置144存储音频信号S，该音频信号S包括用于再现的声音的音频信号SG和识别信息D的调制的信号SD。表示用于再现的声音的发音内容的字符串形式的相关信息Q与识别信息D相关联并且存储在存储装置144中。如图25的示例中所示，终端装置12的控制装置50实时地使通过图像获取装置获取的机器人300的图像G(通常为动态图像)与作为供应自信息管理系统14的相关信息Q的字符串一起显示(覆盖显示)在输出装置58的显示装置上。

在相关信息Q单独显示在显示装置上的构造中，用户将需要在显示装置上显示的图像(相关信息Q)与作为实际展览品的机器人300之间频繁切换他/她的关注点。在参照图25描述的构造中，在单个显示画面上一起显示图像G和相关信息Q。因此，具有用户无需在显示装置与机器人300之间频繁切换他/她的关注点的优点。尤其是，在连同图像G显示用于再现的声音的字符串的构造中，例如，可以实现弱听力人士能够容易地查看机器人300的移动和用于再现的声音的内容的额外优点。

(5)在上述模式中，信息提供系统10被用作展览设施M中的导览。使用信息提供系统10的情形不限于上述示例。例如，可以使用信息提供系统10来提供交通系统(比如火车或公交车)中的语音导览。具体地，比如火车或者公交车之类的车辆配备有声音发射系统16，并且通过信息管理系统14产生音频信号S并随后传输至声音发射系统16，音频信号S根据导览语音V(其提供关于车辆停靠点(比如火车站或公交站)的导览)的音频信号SG产生，并且添加有识别信息D。当车辆移动到停靠点附近时，与该停靠点对应的音频信号S被提供给声音发射系统16的声音发射装置166，从而将对车辆到达停靠点进行播报的导览语音V连同识别信息D一起发射。车辆中的终端装置12从输出装置58输出相关信息Q，响应于包括识别信息D的信息请求R而从信息管理系统14提供相关信息Q。可以准备为相关信息Q的信息的示例包括：表示最初是第一语言的导览语音V的第二语言翻译的语音，如上述模式中描述的那样；以及指示与停靠点周围的关注区域有关的旅游信息的语音或图像(静态或动态)。

(6)上述模式提供了这样的示例构造：各自包括用于再现的声音的音频信号SG和一条识别信息D的调制的信号SD的各音频信号S以及针对每条识别信息D的一条相应相关信息Q被存储在存储装置144中。在该构造中，均对应于共同导览语音V的音频信号S和相关信息Q通过对应的识别信息D彼此关联。可以视情况采用将音频信号SG与相关信息Q彼此关联的具体方法。例如，可以设想这样的构造，其中针对相关信息Q的提供，将指定了位置和时间或者位置的范围和时间的范围的辅助信息与该相关信息Q相关联，并存储在存储装置144中。辅助信息可以指定例如要再现相应音频信号SG的位置和时间。终端装置12向信息管理系统14发送包括时间和位置检测装置(比如全球定位系统(GPS))检测到的终端装置12的位置信息的信息请求R。信息管理系统14的信息提供器36从存储在存储装置144中的多条相关信息Q中选择与分别接近信息请求R中指定的时间和位置信息的时间和位置中的每一个相对应的一条相关信息Q(SB4)，并且随后将该条所选的相关信息Q发送至请求源终端装置12(SB5)。在该构造中，在无需识别信息D的情况下，可以如上述模式中那样向终端装置12提供与音频信号SG对应的相关信息Q。

(7)在上述模式中，从声音发射装置166中发射包括导览语音V的音频信号SG和识别信息D的调制的信号SD的音频信号S的声音。一旦发射导览语音V就向终端装置12通知识别信息D的方式不限于上述示例。例如，可以根据从导览语音V的接收的声音导出的接收的音频信号X的特征(实质上音频信号SG的特征)来对识别信息D进行识别。更具体地，如图26中示出的示例那样，将匹配器15添加至与上述模式中的信息提供系统类似的信息提供系统10。例如，通过能够经由通信网络18与终端装置12进行通信的服务器来实现匹配器15。匹配器15具有搜索表TBL，在该搜索表TBL中各条辨识信息W(W1、W2等)(其表示从声音发射系统16的声音发射装置166发射的导览语音V的音频信号SG的特征)与导览语音V的各条识别信息D(D1、D2等)彼此相关联。

在图26示出的构造中，声音发射系统16的声音发射装置166发射由音频信号SG表示的导览语音V，但是不发射识别信息D的声音分量。终端装置12的控制装置50将导览语音V的接收的音频信号X存储在存储装置52中，接收的音频信号X根据声音接收装置56所接收的声音导出，在特定长度时间(例如，几秒)之后，通信装置54的发射器542将接收的音频信号X发送至匹配器15。即，终端装置12参照匹配器15来寻求声音接收装置56所接收的导览语音V的识别信息D。

匹配器15分析经由通信网络18从终端装置12接收到的接收的音频信号X的特征，并从搜索表TBL搜索具有与所分析的特征类似或匹配的特征的一条辨识信息W。可以随意选择对辨识信息W进行搜索的方式。例如，优选使用自动内容识别技术。匹配器15获取与从搜索表TBL搜索到的一条辨识信息W对应的一条识别信息D，并且将获取到的信息发送至终端装置12。因此，从声音发射装置166发射的导览语音V的识别信息D被通知给终端装置12。终端装置12从信息管理系统14获取与从匹配器15通知的该条识别信息D对应的一条相关信息Q的操作类似于上述模式中描述的方式。

虽然以上描述中给出表示音频信号SG的特征的辨识信息W作为示例，但是辨识信息W的内容可以视情况改变。例如，可以将音频信号SG自身(例如，波形数据)记录在搜索表TBL中作为一条辨识信息W。匹配器15从搜索表TBL搜索具有与接收自终端装置12的接收的音频信号X类似或匹配的波形的一条辨识信息W。匹配器15可以包括在信息管理系统14中或终端装置12中。

在上述模式的与导览语音V的发射并行地通过声音通信向终端装置12通知识别信息D的构造中，需要提供能够再现调制的信号SD(包括识别信息D在内)的频带(例如，18kHz或更高且20kHz或更低)的声音发射装置166。在图26示出的构造中，存在这样的优点：不论声音发射装置166可再现的频带如何，都可以向终端装置12通知识别信息D。因此，图26的构造优选用于使用无法再现高音高的可听频带的常规声音发射装置166的情形。在通过声音通信向终端装置12通知识别信息D的构造中，存在这样的优点：终端装置12无需向匹配器15发送接收的音频信号X，从而减小了通信量，并且无需使用利用接收的音频信号X搜索识别信息D的匹配器15。

(8)可以通过使用单独装置或通过物理地彼此分开的多个装置(服务器)来形成上述模式中描述的信息管理系统14。例如，可以采用将上述模式中的信息管理系统14分布于包括识别信息设置器26的第一服务器和包括不同于识别信息设置器26的元件的第二服务器的构造，第一服务器和第二服务器经由例如通信网络18来彼此进行通信。从以上描述中将显而易见的是，本发明的信息提供系统10涵盖单独装置和装置的集合这两者。此外，可以由单个装置形成包括信息管理系统14和声音发射系统16的整个信息提供系统10。

(9)虽然在上述模式中用于提供展览设施M中的导览的导览语音V的再现被示出为示例，但是声音发射系统16的声音发射装置166可以发射的声音的类型不限于导览语音V。例如，上述模式可以用于再现各种声音，比如音乐。从以上描述中还将显而易见的是，上述模式中的音频信号SG可以统一地表示为指示待再现的声音(用于再现的声音)的信号。

(10)在上述模式中，示出了这样的构造，其中声音发射系统16的声音发射装置166发射与音频信号S对应的声音，每个音频信号S包括表示导览语音V的音频信号SG和包括识别信息D的调制的信号SD。但是，可以省略导览语音V(用于再现的声音)的再现。具体地，信息管理系统14的信号处理器32可以将包括识别信息设置器26分配的识别信息D的调制的信号SD作为音频信号S(音频文件)传输至声音发射系统16。声音发射系统16通过将音频信号S提供至声音发射装置166来发射识别信息D的声音。终端装置12从接收的音频信号X(其通过声音接收装置56接收从声音发射系统16发射的声音而产生)中提取识别信息D。随后，终端装置12从信息管理系统14的信息提供器36获取与识别信息D对应的相关信息Q。从以上描述中将显而易见的是，声音接收装置56统一地表示为通过接收根据各音频信号S(其包括各自包括识别信息D的各调制的信号SD)发射的声音来产生接收的音频信号X的元件。但是，并没有对音频信号S是否包括导览语音V的音频信号SG进行规定。

(11)在上述模式中，使用声音通信来向终端装置12通知识别信息D。用于向终端装置12通知识别信息D的通信方案不限于上述示例。例如，利用红外线或无线电波的无线通信(例如，近场通信)可用于向终端装置12通知识别信息D。

(12)产生导览语音的音频信号SG的方式或产生相关信息Q的方式不限于上述模式中给出的示例(图3、图10至图22)。关于第三实施例，音频信号获取器22、相关信息获取器24、识别信息设置器26、信号处理器32和关联管理器34均非必要元件，只要信息管理系统14包括信息提供器36和存储装置144即可。因此，可以采用其中单独装置包括这些元件并且使得存储装置144存储音频信号S和相关信息Q的构造。

(13)在上述模式中，信息管理系统、声音发射系统和终端装置均可以通过控制装置及协作程序或通过使用专用电路来实现。根据本发明的程序可以以存储有程序的计算机可读存储介质的形式来提供，并且可安装在计算机中。例如，存储介质可以为非暂时性存储介质，其代表示例为光存储介质(光盘)，比如CD-ROM。这种存储介质的示例还可以包括任何类型的公知存储介质，比如磁存储介质或半导体存储介质。根据本发明的程序可以通过通信网络分发并且可安装在计算机中。

附图标记

100…通信系统；10…信息提供系统；12…终端装置；14…信息管理系统；142…控制装置；144…存储装置；146…输入装置；148…显示装置；16…声音发射系统；162…控制装置；164…存储装置；166…声音发射装置；18…通信网络；22…音频信号获取器；24…相关信息获取器；26…识别信息设置器；32…信号处理器；322…解调处理器；324…混合处理器；34…关联管理器；36…信息提供器；50…控制装置；51…信息提取器；52…存储装置；54…通信装置；542…发射器；544…获取器；56…声音接收装置；58…输出装置；200…信号供应装置。

Claims

1.一种信息管理系统，包括：

音频信号获取装置，其构造为获取表示用于再现的声音的音频信号；

相关信息获取装置，其构造为获取与所述用于再现的声音有关的一条相关信息；

关联管理装置，其构造为将所述相关信息获取装置针对所述用于再现的声音获取的所述一条相关信息与一旦发射与所述音频信号对应的所述用于再现的声音就通知给终端装置的一条识别信息相关联；和

信息提供装置，其构造为从所述终端装置接收包括通知给所述终端装置的所述一条识别信息的信息请求，并向所述终端装置发送通过所述关联管理装置而与所述一条识别信息相关联的所述一条相关信息。

2.根据权利要求1所述的信息管理系统，还包括：信号处理装置，其构造为产生音频信号，该音频信号包括所述音频信号获取装置获取的音频信号和包括所述一条识别信息的调制的信号。

3.根据权利要求2所述的信息管理系统，

其中，所述信号处理装置将包括各条识别信息的各个调制的信号添加至各再现部分，所述各再现部分是通过所述音频信号获取装置获取的音频信号的时间轴分开部分，其中，各调制的信号中的各条识别信息在各再现部分之间彼此不同，并且

其中，所述关联管理装置将所述相关信息获取装置针对每个再现部分获取的一条相关信息与对应于该再现部分的一条识别信息相关联。

4.根据权利要求1至3中任一项所述的信息管理系统，其中，所述音频信号获取装置通过语音合成产生指示了所述用于再现的声音的音频信号，所述用于再现的声音是与用户指令相符合的字符串的发音声。

5.根据权利要求1至4中任一项所述的信息管理系统，其中，所述相关信息获取装置通过对指示了所述用于再现的声音的发音内容的字符串的机器翻译来产生指示了所述用于再现的声音的翻译的所述一条相关信息。

6.根据权利要求1至4中任一项所述的信息管理系统，其中，所述相关信息获取装置通过对指示了所述用于再现的声音的发音内容的字符串的机器翻译来产生指示了所述用于再现的声音的翻译的字符串，并且进一步通过语音合成产生指示了指示所述翻译的字符串的发音声的音频信号作为所述一条相关信息，该音频信号从而指示了所述用于再现的声音的翻译。

7.根据权利要求1至4中任一项所述的信息管理系统，其中，所述相关信息获取装置获取与所述用于再现的声音相关的图像作为所述一条相关信息。

8.根据权利要求1至3中任一项所述的信息管理系统，

其中，所述音频信号获取装置获取指示了所述用于再现的声音的音频信号，该音频信号从信号供应装置供应，并且

其中，所述相关信息获取装置通过语音识别、根据从所述信号供应装置供应的音频信号产生指示了所述用于再现的声音的发音内容的字符串作为所述一条相关信息。

9.根据权利要求1至3中任一项所述的信息管理系统，

其中，所述相关信息获取装置通过语音识别、根据从所述信号供应装置供应的音频信号产生指示了所述用于再现的声音的发音内容的字符串，并且通过对所产生的字符串的机器翻译，产生指示了所述用于再现的声音的翻译的所述一条相关信息。

10.根据权利要求1至3中任一项所述的信息管理系统，

其中，所述相关信息获取装置通过语音识别、根据从所述信号供应装置供应的音频信号产生指示了所述用于再现的声音的发音内容的字符串，并且通过对所产生的字符串的机器翻译，产生指示了所述用于再现的声音的翻译的字符串，并且还通过语音合成产生指示了指示所述翻译的字符串的发音声的音频信号作为所述一条相关信息，该音频信号从而指示了所述用于再现的声音的翻译。

11.根据权利要求1至3中任一项所述的信息管理系统，

其中，所述相关信息获取装置通过语音识别、根据从所述信号供应装置供应的音频信号产生指示了所述用于再现的声音的发音内容的字符串，并且获取指示了所述用于再现的声音的翻译并通过在输入装置上执行的操作而被指定为所产生的字符串的翻译的字符串，作为所述一条相关信息。

12.根据权利要求1至3中任一项所述的信息管理系统，

其中，所述相关信息获取装置通过语音识别、根据从所述信号供应装置供应的音频信号产生指示了所述用于再现的声音的发音内容的字符串，并且通过对所产生的字符串的机器翻译，产生指示了所述用于再现的声音的翻译的字符串，并且获取指示了所述用于再现的声音的翻译并已经通过在输入装置上执行的操作而编辑了的字符串，作为所述一条相关信息。

13.根据权利要求1至3中任一项所述的信息管理系统，

其中，所述相关信息获取装置获取与从所述信号供应装置供应的音频信号有关的内容，作为所述一条相关信息。

14.一种信息管理方法，包括：

获取表示用于再现的声音的音频信号；

获取与所述用于再现的声音有关的一条相关信息；

将针对所述用于再现的声音获取的所述一条相关信息与一旦发射与所述音频信号对应的所述用于再现的声音就通知给终端装置的一条识别信息相关联，并且将所述一条相关信息和所述一条识别信息存储在存储装置中；和

从所述终端装置接收包括通知给所述终端装置的所述一条识别信息的信息请求，并向所述终端装置发送与所述一条识别信息相关联并存储在所述存储装置中的所述一条相关信息。

15.一种存储有程序的计算机可读存储介质，所述程序使得计算机执行：

音频信号获取处理，其获取表示用于再现的声音的音频信号；

相关信息获取处理，其获取与所述用于再现的声音有关的一条相关信息；

关联管理处理，其将相关信息获取处理中针对所述用于再现的声音获取的所述一条相关信息与一旦发射与所述音频信号对应的所述用于再现的声音就通知给终端装置的一条识别信息相关联；和

信息提供处理，其从所述终端装置接收包括通知给所述终端装置的所述一条识别信息的信息请求，并向所述终端装置发送在所述关联管理处理中与所述一条识别信息相关联的所述一条相关信息。