信息检索访问协议(TAPIR)

标题: TDWG信息检索访问协议
创建日期: 2010-05-05
状态: 目前的标准
类别: 技术规范
永久IRI: //www.nancyp.com/standards/449
摘要: TAPIR是一种计算机协议，设计用于发现、搜索和检索Internet上的分布式数据。TAPIR由一个规范这决定了寻找信息的客户机应用程序应该如何与承载数据的服务器应用程序通信。TAPIR是经过批准的TDWG标准。
创造者: 生物多样性信息标准
书目引文: De Giovanni R, Döring M, Güntsch A, Vieglais D, Hobern D, De la Torre J, Wieczorek J, Gales R, Hyam R, Blum S, Perry S (2010) TDWG Access Protocol for Information Retrieval (TAPIR)， Version 1.0。生物多样性信息标准//www.nancyp.com/standards/449

动机

DiGIR和BioCASe从地理分布的生物收集中获取历史数据的替代方案是否已开发出来?虽然DiGIR和BioCASe在各自的领域都取得了成功，但它们之间的不兼容性使得生物多样性数据的交换比本来应该的要复杂得多。TDWG信息检索访问协议TAPIR是一个解决此问题并添加新功能的国际项目。

貘是如何工作的

TAPIR网络由具有不同数据库系统和不同数据结构的分布式数据提供者组成，但它们都具有相同类型的内容。假设一组自然历史博物馆希望通过一个Web搜索页面提供它们的生物标本数据。每个组织在不同的计算机环境中有自己的数据库。例如，一些可能使用商业集合管理软件，另一些可能使用开源软件环境，甚至只是一个简单的电子表格。它们的共同需求是通过单个Web页面访问所有数据库，并生成对搜索者的组合和集成响应。

由于所有数据库都包含相同类型的内容，因此可以定义所谓的数据抽象层。DarwinCore是生物多样性数据的数据抽象层的一个例子。DarwinCore详细说明了一个标本或对一个标本的观察，例如生物的名称、地点、时间和采集人。TAPIR使用一个或多个数据抽象层，使搜索者觉得所有独立的数据库都像是一个大型集成数据库。

数据提供者通常不需要更改数据库，也不需要定期导出数据。相反，他们通常会安装一个“包装”软件应用程序，然后以数据抽象层中的每个概念对应于自己数据库中的特定字段的方式配置它。

这个包装器接收远程TAPIR搜索请求，将其转换为本地语言和数据结构，将其应用于数据库，然后将一个TAPIR搜索响应发送回搜索者。

TAPIR非常灵活，可以应用于广泛的应用中。其他的例子包括收集数据以构建一个中央数据库，使用不同的Web格式(例如RSS、RDF或KML)共享数据，或者构建Web界面以帮助浏览或搜索任何数据库。

貘的关键特性

与Web基础设施很好地集成，因为它基于已建立的国际Web标准，如HTTP、XML和XML Schema。
独立于正在交换的数据，因此可以用来访问广泛的数据。
可以返回许多不同格式的数据-搜索响应是灵活的和可定制的。
包括五种操作，涵盖网络中搜索和检索数据的所有必要方面:对元数据(描述性数据)的访问和提供者的功能、初步数据发现和数据挖掘、搜索和监视数据提供者服务。
允许通过简单的Web地址调用所有操作。
支持复杂的请求。
拥有现有的TAPIR包装应用程序，包括PyWrapper、TapirLink和TapirDotNET。

资源

软件

TapirLink:原来的PHP TapirLink软件是在SourceForge上的主机:http://sourceforge.net/projects/digir/files/TapirLink/和http://sourceforge.net/p/digir/svn/HEAD/tree/tapirlink/
PyWrapper:一个python提供商软件，基于BioCASE的前身:http://sourceforge.net/p/digir/svn/HEAD/tree/pywrapper/
貘测试仪：http://sourceforge.net/p/digir/svn/HEAD/tree/tapirtester/
貘建设者：http://sourceforge.net/p/digir/svn/HEAD/tree/tapirbuilder/

信息检索TDWG访问协议(TAPIR)

头部分

动机

貘是如何工作的

貘的关键特性

资源

软件