CN101512521A - 基于概念对语音文档的跨媒体索引和检索 - Google Patents

基于概念对语音文档的跨媒体索引和检索 Download PDF

Info

Publication number
CN101512521A
CN101512521A CNA200780020395XA CN200780020395A CN101512521A CN 101512521 A CN101512521 A CN 101512521A CN A200780020395X A CNA200780020395X A CN A200780020395XA CN 200780020395 A CN200780020395 A CN 200780020395A CN 101512521 A CN101512521 A CN 101512521A
Authority
CN
China
Prior art keywords
document
vector
phoneme
speech
documents
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA200780020395XA
Other languages
English (en)
Other versions
CN101512521B (zh
Inventor
C·A·伯赫恩斯
D·伊甘
D·巴苏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Iconectiv LLC
Original Assignee
Telcordia Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telcordia Technologies Inc filed Critical Telcordia Technologies Inc
Publication of CN101512521A publication Critical patent/CN101512521A/zh
Application granted granted Critical
Publication of CN101512521B publication Critical patent/CN101512521B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/685Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using automatically derived transcript of audio data, e.g. lyrics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3343Query execution using phonetics

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Library & Information Science (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

通过寻找和检索在概念级别与查询项相关的语音文档——即便这些语音文档并不包含发音的(或文本的)查询项——来达成索引、搜索、以及检索语音文档(包括但不限于录音书籍、音频广播、录音会话)的内容。使用基于概念的跨媒体信息检索。从训练文档集构造项-音素/文档矩阵。文档随后被添加到从训练数据构造成的矩阵中。使用奇异值分解来从该项-音素/文档矩阵计算矢量空间。结果是较低维的数值空间,其中项-音素和文档矢量在概念上作为最近邻居来相关。查询引擎计算该查询矢量与该空间中的所有其他矢量之间的余弦值,并且返回具有最高余弦值的那些项-音素和/或文档的列表。

Description

基于概念对语音文档的跨媒体索引和检索
相关申请的交叉引用
本申请要求2006年6月2日提交的美国临时专利申请No.60/810,786的权益,其通过引用整体纳入于此。
发明领域
本发明一般涉及潜在语义索引技术。本发明尤其涉及索引、搜索、以及检索语音文档的内容。
发明背景
索引、搜索、以及检索发音文档(包括但不限于录音书籍、音频广播、录音会话)的内容是个难题。当前的办法典型地或者通过将用户提供的文本查询与文本元数据相匹配或者通过在按音标转录该查询后进行音标匹配来使得能够经由关键字匹配的等效技术方案进行搜索和检索。该办法产出很低的查全率,即对于查询而言可能有许多相关语音文档没有被寻找。代替关键字匹配,我们通过寻找和检索在概念级别与查询相关的发音文档——即便这些文档并不包含发音的(或文本的)查询项——来解决此问题。
发明概述
现有技术提供音标索引,其中语音音频文档的音标内容被转录成中间语言并且文本或声音查询也被转录成该相同的中间语言,如此使得语音片段能与查询进行匹配。相反,本发明从一种新颖的包括语音文档的音标转录及其文本转录的“双重文档”计算搜索空间。在此办法中,双重文档是包含两种语符(token)——词和音素——的“包”。这些双重文档的文集将被用作训练集,其用于如此来计算在其中音素、词和文档(语音和文本)将由矢量来代表的矢量空间以使得表达相关概念的那些音素、词和文档在该空间中将是最近的邻居。可利用最近邻居关系来为或者文本或者语音查询寻找和检索语音文档,或为语音查询寻找和检索文本文档。这将被引述为“基于概念的跨媒体信息检索”。不像其他需要从语音翻译成自然语言文本以基于概念来索引内容的方法,本发明的有吸引力的特征之一在于内容是使用音标转录在更抽象的概念级别来索引的。此特征降低了索引语音的出错率和成本两者。
在结合附图阅读以下说明时将能更清楚地理解本发明。
附图简要说明
图1是用于实践本发明的语义索引系统的实施例的示意图。
详细说明
参考图1,示意性地示出包括本发明的索引系统100的实施例。该系统包括摄入/收集文档102、预处理器/注册文档104、目录文档106、扩充目录(SVD)108以及查询引擎/目录110。处理在机器或人将一组文档放入文档集合区域102中时开始。图书管理员注册这些文档并准备它们以供编目。编目在数据库中为文档创建元数据的文本和数值两种记录,并且应用计算在其中所有文本连同其项和音素被索引的矢量空间所需要的所有附加处理。该目录可用新文档通过遵循相同的摄入/收集-注册-目录顺序来规律地扩充。然而,在目录扩充时文档被索引但不用于计算矢量空间。而且,最终用户可规律地查询该目录、其矢量及其相关联的元数据以寻找相关文档。文档注册、编目和查询处理作为网络服务而可用。一旦这些服务由管理员启动,它们就对其用户并对彼此可用。例如,注册服务在有新文档要索引时通知目录服务。图书管理员必须通过使用所提供的图形用户界面(GUI)114注册文档来“触发”该过程流。
根据本发明的原始源数据包括文本和语音文档;这些中有一些是由语音文档及其相对应的文本转录构成的双重文档,而其他的是“单本”,即或者是文本或者是语音文档而没有另一格式的对应表达。提供了用于将这些文档摄入并收集到内容储存库中的手段。这可能仅仅需要将文档转移到已知集合位置,例如文件目录或文件夹,在此它们可被注册新文档的过程检测到。
文档注册在内容目录中为文档创建记录,包括诸如文档类型、创建日期和位置之类的元数据的创建,并将该文档排队待预处理。在该预处理步骤中完成若干事项。首先,必须将所有语音文档按音标转录(116)成中间表达语言。一种如此的自动音标转录器是用于自动音标转录的Nexidia公司语音智
Figure A200780020395D00051
(Speech
Figure A200780020395D00061
)。本发明并不被限定于该特定的音标转录器。其次,使用文档转换器118(例如StellentTM
Figure A200780020395D00062
产品)将文档从本机格式转换到UTF-8,即进行基于概念的预处理所要求的文档编码。本发明并不被限定于该特定的文档转换器。第三,文档被分段(120),即音标转录,并且其相应的文本被语符化如此使得能够获得对索引项和音素112的计数。第四,使文档入队供编目,在此情形中是编目文档集合目录。
进一步的处理要求集合在其训练文档与其他仅索引文档之间加以区分。训练文档用于计算概念矢量空间,而仅索引文档则不然。在后一种情形下,矢量被计算出(108)并用于扩充该目录。由于本发明支持跨媒体的信息检索,因此文档还应该按媒体类型——在此情形中是文本或语音——被隔离。
一旦集合中的所有文档都被预处理了,词/音素计数就被存储在集合目录106中作为文档的元数据的一部分。从这些计数构造非常大的稀疏矩阵,其中为训练集中的每一项和每一音素创建一行,并为该训练集中的每一文档创建一列。该“项-音素/文档”矩阵中的条目是词和音素计数,即特定的可索引词和可索引音素在文档中出现的次数。在可以用该矩阵来计算矢量空间之前,必须将其条目归一化。该要求的原因是一些文档可能比其他的长很多,而一些项或音素可能有在文档或在集合中比其他的项或音素出现得频繁得多的趋势。因此,有必要减少文档长度和高频度语符在训练集中的作用。这通过对项-音素/文档矩阵112中的原始语符计数应用恰适的加权来达成。
如以上述及的,本发明使用以奇异值分解(或即SVD)著称的统计技术108来从由训练文档集构造出的项-音素/文档矩阵112计算矢量空间。所产生的结果是较低维的数值空间,其中概念上相关的项-音素和文档矢量是最近的邻居。就是这种特性允许为查询找到项或文档——即便这些文档并不拥有这些查询项中的任一个;这些文档不必包含该查询,它们仅需要是计算出的矢量空间中与查询矢量最近的邻居。
一旦已为训练文档集计算出矢量空间,就必须为新文档计算矢量,并且随后将这些矢量添加到该空间中。此操作仅仅要求将这些新文档放入也为图书管理员所知的团队集合区域中。一旦在这里了,图书管理员就可以如对训练集那样通过注册它们来将它们入队供处理。类似于训练文档,为每一文档在内容目录中创建包括词或音素计数的记录;然而不同于训练文档,这些文档并不用于计算矢量空间。出于调入目的,文档可仅包含词或仅包含音素,而不必包含这两者。其矢量表达将用其词矢量或音素矢量来计算。通过对每一文档包含的词和音素进行项或音素矢量求和——其中每一项或音素矢量由其各自的词或音素计数来加权——来为该文档创建矢量。一旦这些新文档的矢量被“调入”到矢量空间中,这些文档就与已在那里的文档一起可以用搜索。
文档查询使得必须搜索内容目录以寻找相关元数据,包括搜索计算出的矢量空间以寻找类似于或“接近于”为一组一个或更多个查询项或音素计算出的矢量的矢量。查询引擎110穷尽地计算该查询矢量与空间中的所有其他矢量之间的余弦值,并且以列表来返回具有最高余弦值的那些项-音素和/或文档。很像文档矢量的是,查询矢量仅仅是其包含的词或音素的矢量之和,其每一个由它们在该查询中出现的频度(这对于大多数自组织查询而言仅为一次)来加权。查询可由词或由音素构成。其矢量用从计算出的LSI矢量空间推导出的或者这些词矢量或者音素矢量的加权和来计算。LSI是潜在语义索引。应注意,查询矢量也可从文档的全部或部分诸如在“相关性反馈”中的部分来计算。在将相关文档作为查询提交给查询引擎以寻找“更多像这样的文档”的场合就是这种情形。再次,这些可以是或者语音或者文本文档。最终用户可选择命中列表上的项以用于从内容储存库中检索,因为该列表还传达与内容描述性元数据一起存储在目录中的访问描述性元数据,例如文档的URL。
以上所描述的算法和建模能够在诸如计算设备之类的指令执行系统、装置、或设备上执行。这些算法自身可包含在计算机可读介质上,计算机可读介质可以是能够包含、存储、传递、传播、或传送程序供由诸如计算机之类的指令执行系统、装置、或设备使用或联合其使用的任何装置。
虽然已描述和图解了索引、搜索以及检索语音文档的方法和系统,但对于本领域技术人员显而易见的是,变形和修改是可能的而不会脱离本发明的广泛教示和原理,本发明应单单由所附权利要求书的范围来限定。

Claims (13)

1.一种跨媒体索引、注册和检索语音文档的方法,包括以下步骤:
注册训练文档集;
预处理每一训练文档;
从所述训练文档的元数据构造项-音素/文档矩阵,其中为所述训练文档中的项和每一音素创建行,并为每一训练文档创建列;
归一化所述项-音素/文档矩阵中的条目;
通过从所述项-音素/文档矩阵计算来从所述训练文档计算概念矢量空间;
为新文档计算矢量并将所述矢量添加到所述矢量空间;
搜索所述计算出的矢量空间以寻找接近为查询项或音素计算出的矢量的矢量;以及
提供具有最高值的那些语音和/或文本文档的列表。
2.如权利要求1所述的方法,其特征在于,所述预处理包括为每一训练文档创建记录,包括为每一训练文档创建元数据。
3.如权利要求1所述的方法,其特征在于,所述预处理包括将每一语音文档按音标转录成中间表达语言;将每一文档从本机格式转换成UTF-8格式;将每一文档分段;以及将每一文档入队供编目。
4.如权利要求3所述的方法,其特征在于,所述分段包括语符化每一音标转录和经转换的文本如此使得能获得对索引项和音素的计数。
5.如权利要求1所述的方法,其特征在于,所述计算概念矢量空间包括使用奇异值分解技术。
6.如权利要求1所述的方法,其特征在于,所述为新文档计算矢量并将其矢量添加到所述矢量空间包括为每一文档通过对所述文档包含的词和音素进行项或音素矢量求和——其中每一项或音素矢量由其各自的词或音素计数来加权——来创建。
7.如权利要求1所述的方法,其特征在于,所述搜索计算出的矢量空间以寻找接近为查询项或音素计算出的矢量的矢量包括计算查询矢量与所述空间中的所有其他矢量之间的余弦值,并且以列表返回具有最高余弦值的文本和/或语音文档。
8.一种用于跨媒体索引、注册和检索语音文档的系统,包括以下步骤:
文档集合装置,用于注册训练文档集、准备所述训练文档集供编目、以及索引所述训练文档集,包括文档项和音素;
预处理器,用于预处理每一训练文档以及通过从所述训练文档集计算矢量来从所述训练文档计算形成概念矢量空间的矢量;
从所述训练文档的元数据构造的项-音素/文档矩阵,其中为所述训练文档中的每一项和每一音素创建行,并为每一训练文档创建列,并且所述项-音素/文档矩阵中的条目被归一化;
奇异值分解装置,用于从所述项-音素/文档矩阵计算矢量空间;
所述预处理器还预处理每一新文档并从所述新文档计算矢量并且将所述矢量添加到所述矢量空间;以及
查询引擎,用于搜索所述计算出的矢量空间以寻找接近为一个或更多个查询项或音素计算出的矢量的矢量;以及提供具有最高值的那些文本和/或语音文档的列表。
9.如权利要求8所述的系统,其特征在于,所述预处理器为每一训练文档创建记录,包括为每一训练文档创建元数据。
10.如权利要求8所述的系统,其特征在于,所述预处理器将每一语音文档按音标转录成中间表达语言;将每一文档从本机格式转换成UTF-8格式;将每一文档分段;以及将每一文档队列供编目。
11.如权利要求10所述的系统,其特征在于,所述预处理器通过语符化每一音标转录和经转换的文本如此使得能获得对索引项和音素的计数来将每一文档分段。
12.如权利要求8所述的系统,其特征在于,所述预处理器进一步为每一文档通过对所述文档包含的词或音素进行项或音素矢量求和——其中每一项或音素矢量由其各自的词或音素计数来加权——来为新文档计算矢量并将所述矢量添加到所述矢量空间。
13.如权利要求8所述的系统,其特征在于,所述搜索引擎通过计算查询矢量与计算出的矢量空间中的所有其他矢量之间的余弦值、并且以列表返回具有最高余弦值的文本和/或语音文档来搜索所述空间以寻找接近为查询项或音素计算出的矢量的矢量。
CN200780020395XA 2006-06-02 2007-06-01 基于概念对语音文档的跨媒体索引和检索 Active CN101512521B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US81078606P 2006-06-02 2006-06-02
US60/810,786 2006-06-02
PCT/US2007/012965 WO2007143109A2 (en) 2006-06-02 2007-06-01 Concept based cross media indexing and retrieval of speech documents

Publications (2)

Publication Number Publication Date
CN101512521A true CN101512521A (zh) 2009-08-19
CN101512521B CN101512521B (zh) 2013-01-16

Family

ID=38802089

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200780020395XA Active CN101512521B (zh) 2006-06-02 2007-06-01 基于概念对语音文档的跨媒体索引和检索

Country Status (6)

Country Link
US (1) US7716221B2 (zh)
EP (1) EP2030132A4 (zh)
JP (1) JP2009540398A (zh)
CN (1) CN101512521B (zh)
CA (1) CA2653932C (zh)
WO (1) WO2007143109A2 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106663429A (zh) * 2014-03-10 2017-05-10 韦利通公司 提供音频录音以供内容资源中使用的引擎、系统和方法

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8442197B1 (en) 2006-03-30 2013-05-14 Avaya Inc. Telephone-based user interface for participating simultaneously in more than one teleconference
KR100893629B1 (ko) * 2007-02-12 2009-04-20 주식회사 이지씨앤씨 전자교재 컨텐츠의 구문에 식별코드를 부여하는 시스템 및방법, 전자교재 컨텐츠의 데이터 검색 시스템 및 방법,전자교재 컨텐츠의 사용과 제공에 관한 포인트 관리 시스템및 방법
US7923790B1 (en) * 2007-03-09 2011-04-12 Silicon Laboratories Inc. Planar microshells for vacuum encapsulated devices and damascene method of manufacture
EP2245555A1 (fr) * 2008-01-30 2010-11-03 France Telecom Procede d'identification d'un document multimedia dans une base de reference, programme d'ordinateur, et dispositif d'identification correspondants
US8229729B2 (en) * 2008-03-25 2012-07-24 International Business Machines Corporation Machine translation in continuous space
US8301619B2 (en) * 2009-02-18 2012-10-30 Avaya Inc. System and method for generating queries
JP4735726B2 (ja) * 2009-02-18 2011-07-27 ソニー株式会社 情報処理装置および方法、並びにプログラム
US8621011B2 (en) 2009-05-12 2013-12-31 Avaya Inc. Treatment of web feeds as work assignment in a contact center
US8437266B2 (en) * 2009-08-26 2013-05-07 Avaya Inc. Flow through call control
US8756215B2 (en) * 2009-12-02 2014-06-17 International Business Machines Corporation Indexing documents
US8903794B2 (en) 2010-02-05 2014-12-02 Microsoft Corporation Generating and presenting lateral concepts
US8983989B2 (en) 2010-02-05 2015-03-17 Microsoft Technology Licensing, Llc Contextual queries
US8260664B2 (en) 2010-02-05 2012-09-04 Microsoft Corporation Semantic advertising selection from lateral concepts and topics
US8150859B2 (en) 2010-02-05 2012-04-03 Microsoft Corporation Semantic table of contents for search results
CN101984424A (zh) * 2010-10-26 2011-03-09 浙江工商大学 海量跨媒体索引方法
KR101252397B1 (ko) * 2011-06-02 2013-04-08 포항공과대학교 산학협력단 웹을 이용한 정보 검색 방법 및 이를 사용하는 음성 대화 방법
GB2494455B (en) * 2011-09-09 2015-06-10 British Broadcasting Corp Processing audio-video data to produce metadata
GB2505400B (en) * 2012-07-18 2015-01-07 Toshiba Res Europ Ltd A speech processing system
US9594542B2 (en) * 2013-06-20 2017-03-14 Viv Labs, Inc. Dynamically evolving cognitive architecture system based on training by third-party developers
US9633317B2 (en) * 2013-06-20 2017-04-25 Viv Labs, Inc. Dynamically evolving cognitive architecture system based on a natural language intent interpreter
US10083009B2 (en) 2013-06-20 2018-09-25 Viv Labs, Inc. Dynamically evolving cognitive architecture system planning
US10474961B2 (en) 2013-06-20 2019-11-12 Viv Labs, Inc. Dynamically evolving cognitive architecture system based on prompting for additional user input
KR102437689B1 (ko) * 2015-09-16 2022-08-30 삼성전자주식회사 음성 인식 서버 및 그 제어 방법
CN106095893B (zh) * 2016-06-06 2018-11-20 北京大学深圳研究生院 一种跨媒体检索方法
CN107273517B (zh) * 2017-06-21 2021-07-23 复旦大学 基于图嵌入学习的图文跨模态检索方法
CN111339261A (zh) * 2020-03-17 2020-06-26 北京香侬慧语科技有限责任公司 一种基于预训练模型的文档抽取方法及系统
CN113239237B (zh) * 2021-07-13 2021-11-30 北京邮电大学 跨媒体大数据搜索方法及装置

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4839853A (en) 1988-09-15 1989-06-13 Bell Communications Research, Inc. Computer information retrieval using latent semantic structure
JPH02195400A (ja) * 1989-01-24 1990-08-01 Canon Inc 音声認識装置
US5301109A (en) * 1990-06-11 1994-04-05 Bell Communications Research, Inc. Computerized cross-language document retrieval using latent semantic indexing
US5941944A (en) * 1997-03-03 1999-08-24 Microsoft Corporation Method for providing a substitute for a requested inaccessible object by identifying substantially similar objects using weights corresponding to object features
US5974412A (en) 1997-09-24 1999-10-26 Sapient Health Network Intelligent query system for automatically indexing information in a database and automatically categorizing users
CA2366057C (en) * 1999-03-05 2009-03-24 Canon Kabushiki Kaisha Database annotation and retrieval
US7151942B1 (en) * 1999-05-04 2006-12-19 Mci, Llc Advertisement broadcasting for paging
US6757646B2 (en) * 2000-03-22 2004-06-29 Insightful Corporation Extended functionality for an inverse inference engine based web search
US6615208B1 (en) 2000-09-01 2003-09-02 Telcordia Technologies, Inc. Automatic recommendation of products using latent semantic indexing of content
US7006969B2 (en) * 2000-11-02 2006-02-28 At&T Corp. System and method of pattern recognition in very high-dimensional space
US7113943B2 (en) * 2000-12-06 2006-09-26 Content Analyst Company, Llc Method for document comparison and selection
US7124081B1 (en) * 2001-09-28 2006-10-17 Apple Computer, Inc. Method and apparatus for speech recognition using latent semantic adaptation
US6985861B2 (en) * 2001-12-12 2006-01-10 Hewlett-Packard Development Company, L.P. Systems and methods for combining subword recognition and whole word recognition of a spoken input
US6877001B2 (en) * 2002-04-25 2005-04-05 Mitsubishi Electric Research Laboratories, Inc. Method and system for retrieving documents with spoken queries
US7542966B2 (en) * 2002-04-25 2009-06-02 Mitsubishi Electric Research Laboratories, Inc. Method and system for retrieving documents with spoken queries
US7152065B2 (en) 2003-05-01 2006-12-19 Telcordia Technologies, Inc. Information retrieval and text mining using distributed latent semantic indexing
JP2006048289A (ja) * 2004-08-03 2006-02-16 Sony Corp 情報処理装置および方法、並びにプログラム
US7765098B2 (en) * 2005-04-26 2010-07-27 Content Analyst Company, Llc Machine translation using vector space representations
US7475063B2 (en) * 2006-04-19 2009-01-06 Google Inc. Augmenting queries with synonyms selected using language statistics

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106663429A (zh) * 2014-03-10 2017-05-10 韦利通公司 提供音频录音以供内容资源中使用的引擎、系统和方法

Also Published As

Publication number Publication date
CN101512521B (zh) 2013-01-16
US20070299838A1 (en) 2007-12-27
CA2653932C (en) 2013-03-19
EP2030132A4 (en) 2010-07-14
WO2007143109A3 (en) 2009-05-07
CA2653932A1 (en) 2007-12-13
JP2009540398A (ja) 2009-11-19
US7716221B2 (en) 2010-05-11
WO2007143109A2 (en) 2007-12-13
EP2030132A2 (en) 2009-03-04

Similar Documents

Publication Publication Date Title
CN101512521B (zh) 基于概念对语音文档的跨媒体索引和检索
Larson et al. Spoken content retrieval: A survey of techniques and technologies
US7292979B2 (en) Time ordered indexing of audio data
US8126897B2 (en) Unified inverted index for video passage retrieval
US20140136197A1 (en) Accuracy improvement of spoken queries transcription using co-occurrence information
US20120131060A1 (en) Systems and methods performing semantic analysis to facilitate audio information searches
JP2011529600A (ja) 意味ベクトルおよびキーワード解析を使用することによるデータセットを関係付けるための方法および装置
Clavel et al. Spontaneous speech and opinion detection: mining call-centre transcripts
JP2007241888A (ja) 情報処理装置および方法、並びにプログラム
Ogata et al. Automatic transcription for a web 2.0 service to search podcasts
Koumpis et al. Content-based access to spoken audio
Carrive et al. Transdisciplinary analysis of a corpus of French newsreels: The ANTRACT Project
Vaiani et al. Leveraging multimodal content for podcast summarization
Fersini et al. Semantics and machine learning: A new generation of court management systems
Chen et al. Exploring the use of unsupervised query modeling techniques for speech recognition and summarization
Hazen et al. Speech-based annotation and retrieval of digital photographs.
Jong et al. Access to recorded interviews: A research agenda
Sen et al. Audio indexing
Naveen et al. Abstractive text summarizer: A comparative study on dot product attention and cosine similarity
Nouza et al. Large-scale processing, indexing and search system for Czech audio-visual cultural heritage archives
Gilbert et al. Speech and language processing over the web
Tiwari et al. Marathi speech database standardization: A review and work
Mizuno et al. A similar content retrieval method for podcast episodes
Chien et al. A spoken‐access approach for chinese text and speech information retrieval
Koržinek et al. Automatic transcription of the polish newsreel

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: TELCORDIA TECH INC.

Free format text: FORMER OWNER: TURLEKODIYA TECHNOLOGY CO., LTD.

Effective date: 20100813

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20100813

Address after: new jersey

Applicant after: Telcordia Tech Inc.

Address before: new jersey

Applicant before: Telcordia Technologies, Inc.

ASS Succession or assignment of patent right

Owner name: TTI INVENTION A LLC

Free format text: FORMER OWNER: TELCORDIA TECH INC.

Effective date: 20120515

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20120515

Address after: Delaware

Applicant after: Telcordia Tech Inc. (US)

Address before: new jersey

Applicant before: Telcordia Tech Inc.

C14 Grant of patent or utility model
GR01 Patent grant