Darwin Core RDF指南

标题
Darwin Core RDF指南
版本发布日期
2016-04-25
创建日期
2015-03-27
TDWG标准的一部分
//www.nancyp.com/standards/450/
这个版本
http://rs.tdwg.org/dwc/terms/guides/rdf/2015-06-02
最新版本
http://rs.tdwg.org/dwc/terms/guides/rdf/
之前的版本
http://rs.tdwg.org/dwc/terms/guides/rdf/2015-03-27
摘要
本指南旨在促进在资源描述框架(RDF)中使用Darwin Core术语。它解释了RDF的基本特性,并提供了如何使用Darwin Core术语和来自其他关键词汇表的术语以RDF形式公开数据的详细信息。它在命名空间中定义术语http://rs.tdwg.org/dwc/iri/它们专门用于非文字对象。
贡献者
Steve Baskauf (TDWG RDF/OWL课题组),John Wieczorek (TDWG达尔文核心课题组),John Deck(基因组生物多样性工作组),Campbell Webb (TDWG RDF/OWL课题组),Paul J. Morris(哈佛大学植物标本/比较博物馆Zoölogy), Mark Schildhauer(国家生态分析与综合中心)(KUNHM)
创造者
Darwin核心和RDF/OWL任务组
书目引文
Darwin核心和RDF/OWL任务组,2015。Darwin Core RDF指南。生物多样性信息标准。http://rs.tdwg.org/dwc/terms/guides/rdf/

1介绍(非规范化)

每种编码方法的信息使用达尔文的核心有一个指南解释如何在这种情况下使用达尔文核心术语。这是对生物多样性数据进行编码的指南资源描述框架

Darwin Core RDF指南针对的是那些希望使用RDF共享由Darwin Core (DwC)属性描述的生物多样性数据的人。它描述了使用RDF表达有关资源的基本信息的社区最佳实践如何与Darwin Core术语相关联,并阐明了如何在RDF中与文字(字符串)和非文字(IRI引用)对象一起使用Darwin Core术语。它不打算解释RDF的模型和语法。有关生物多样性上下文中RDF的一般介绍,请参阅RDF初学者指南.有关RDF的更详细介绍,请参见RDF底漆

1.1本文件内容的现状

本文件的章节被明确标识为规范性或非规范性。所有编号的例子都是非规范性的,即使它们属于被指定为规范性的部分。表可以被指定为非规范性的,即使它们属于被指定为规范性的部分。

1.2基本原理(非规范化)

Darwin Core是一个词汇表,它提供了可用于描述生物多样性领域中实体(在RDF中称为“资源”)的属性和类型的术语。Darwin Core是一个通用词汇表,因为它的术语可以用作许多数据传输系统的一部分。RDF与DwC使用指南中存在的其他数据传输系统有几个重要的不同之处(文字指导而且XML指南).从本质上讲,RDF是一种分布式系统。假设来自一个提供者的数据将链接到来自其他提供者的数据。这也意味着总是有可能发现关于特定资源的新数据属性,而这些属性可能使用不熟悉的术语来描述。这与其他数据传输系统有很大的不同,在其他数据传输系统中,发送方和接收方必须就数据的格式以及记录中术语的组织和解释达成预先存在的协议(以联合模式或人类可理解的文档的形式)。因为RDF旨在促进机器(实际上是称为语义客户机或“客户机”的计算机程序)发现数据和元数据,所以术语的含义和使用必须经过良好的定义,并且客户机可以在没有人工干预的情况下发现术语。为了促进不同数据提供者之间的资源交叉引用,必须使用标准化的、机器可理解的、全局唯一的标识符来标识资源,称为国际化资源标识符(IRIs)。最后,因为任何人都可以在不同意预先确定的模式的情况下对资源进行陈述,RDF本质上是一种高度规范化的关系网络,这与典型的数据库表的本质上是“扁平的”相反。由于这些差异,RDF的有效使用要求它的用户遵守本质上正在发展的关于标识符、数据传输协议和词汇表应用程序的社会约定。以下部分将描述其中一些约定。

1.3 RDF的特点(非规范性)

本节描述RDF的一些基本特性。它的目的不是作为RDF教程,而是提供关于RDF特性的足够信息,以解释为什么需要在RDF中使用Darwin Core的特定指南,以及为什么需要创建额外的Darwin Core名称空间。

1.3.1序列化和语法(非规范性)

RDF模型本身独立于任何特定的序列化语法。下图以一种容易被人类理解的图形形式表示了一组关于图像的事实。

每个箭头表示关于图像的一条语句,在RDF中称为“triple”。这组三元组称为RDF图。资源(用椭圆表示)由IRIs标识。所描述的资源(在本例中为图像< http://bioimages.vanderbilt.edu/kirchoff/ac1490 >在箭头的尾部)被称为三重奏的主题。主题资源的属性由术语IRIs标识,如图所示,其名称空间被缩写(例如,使用dc:http://purl.org/dc/terms/).这个属性称为三元组的谓词。属性的值被称为语句的对象,其文字值(由文本组成)由矩形表示。

这个RDF图可以用一种人类友好的语法序列化,称为简明RDF三元语言(Turtle)

@ prefixrdf:< http://www.w3.org/1999/02/22-rdf-syntax-ns >@ prefixxsd:< http://www.w3.org/2001/XMLSchema >@ prefix使用dc:< http://purl.org/dc/terms/ >< http://bioimages.vanderbilt.edu/kirchoff/ac1490 >一个< http://purl.org/dc/dcmitype/StillImage >使用dc:创建“2010 - 09 - 01 - t03:41:31”^ ^xsd:dateTime使用dc:创造者< http://bioimages.vanderbilt.edu/contact/kirchoff coblea >

这是图表RDF / XML语法

<?xml version = " 1.0 " encoding = " utf - 8 " ?>< rdf: rdfxmlns: rdf =“http://www.w3.org/1999/02/22-rdf-syntax-ns”xmlns:使用dc =“http://purl.org/dc/terms/”>< rdf:描述rdf: about =“http://bioimages.vanderbilt.edu/kirchoff/ac1490”>< rdf: typerdf: resource =“http://purl.org/dc/dcmitype/StillImage”/><使用dc:创造者rdf: resource =“http://bioimages.vanderbilt.edu/contact/kirchoff # coblea”/><使用dc:创建rdf:数据类型=“http://www.w3.org/2001/XMLSchema dateTime”>2010 - 09 - 01 - t03:41:31> < /使用dc:创建> < / rdf:描述< / rdf: rdf >

在本文档中,将使用以下格式约定。完整的IRIs须用尖括号括起,例如:

< http://bioimages.vanderbilt.edu/contact/kirchoff coblea >

缩写的uiri将显示为内联代码在表单中名称空间:localName,例如,rdf: type.名称空间缩写在单独显示时也将以斜体显示,例如:dwc:.示例将以代码块的形式显示。

XML是一种被广泛理解的RDF序列化形式。因此,这里给出的所有示例都将以RDF/XML的形式显示。在大多数情况下,它们也会在Turtle中显示。有关RDF序列化的更多详细信息,请参见RDF初学者指南的第3部分还有这里引用的参考文献。

1.3.2国际化资源标识(IRI)(非规范性)

数据提供者使用各种标识符来引用它们希望提供的资源。这些标识符在提供者的数据库中可能是本地唯一的,也可能是全局唯一的。提供程序试图通过诸如“Darwin Core Triplets”(institutional code:collectionCode:catalogNumber)和创建uuid.但是,只有标识符的形式虹膜可以是RDF中语句(称为RDF三元组)的有效主题,因此“Darwin Core三元组”和uuid都不能以未经修改的形式用于此目的。IRIs是一种更窄形式的标识符的超集,称为统一资源标识符(uri),可用于代替虹膜.本文件仅指综合注册资讯系统,但有一项谅解,即综合注册资讯系统可用于取代综合注册资讯系统。

IRI最常见的形式是统一资源定位器(URL),它不仅标识资源,还提供关于检索信息资源(即可以以电子形式传输的资源)的信息,例如HTML网页形式的文本。不过,一般而言,综合信息系统可能会识别无法以电子方式传送的非信息资源(物理或概念实体),例如:< http://bioimages.vanderbilt.edu/contact/kirchoff coblea >,一个人。如果客户端试图通过解除对其HTTP IRI的引用来检索非信息资源,这个过程称为内容协商用于将客户端引用到非信息资源的信息资源表示的IRI。对于人类来说,这通常是一个网页,而对于语义客户机(机器)来说,表示形式是RDF/XML格式的文档。有关IRIs的详细信息,请参见RDF初学者指南的第1部分还有这里引用的参考文献。

1.3.2.1持久标识符(规范)

最佳实践要求标识符(称为持久标识符或全局惟一标识符:guid)用于标识永久感兴趣的资源,必须是全局惟一的、引用一致的和持久的(TDWG全球唯一标识符(GUID)适用性声明:).如果要使用这些标识符来标识RDF中的主题资源,那么它们还必须采用IRI的形式。这对数据提供者有两个含义。

首先,如果使用非IRI全局唯一标识符来标识主题资源,则必须通过使其符合众所周知的IRI方案(例如,aURN或HTTP IRI).例如,UUID可以转换为通过在其字符串表示形式前面加上urn: uuid:就像在

< urn: uuid: f81d4fae-7dec-11d0-a765-00a0c91e6bf6 >

同样的,isbn可以转换为urn如例13和14所示。尽管这些urn是有效的iri,但它们的缺点是不可操作(参见1.3.2.2节).相比之下,“达尔文核三联体”

MVZ: Mamm: 165861

已经变成一个可操作的IRI附加到基字符串http://arctos.database.museum/guid/

< http://arctos.database.museum/guid/MVZ: Mamm: 165861 >

其次,如果提供者使用一个URL引用一个资源,该URL提供了关于该资源的数据,提供者应该注意确保URL不会随着时间的推移而改变(例如,如果内容移动到不同的服务器,如果目录结构发生了变化,或者如果数据库引入了一个新版本)。它可能是最好的使用内容协商将用户从指向该资源的持久IRI重定向到描述该资源的web页面的URL。

有关持久标识符的更详细介绍,请参见GBIF持久标识符初学者指南

根据设立的先例TDWG LSID适用性声明标准,建议将基于urn的iri与http代理等价物(如果存在)关联起来2.2.3节

1.3.2.2 HTTP iri作为自解析guid(规范)

原则的倡导者关联数据的后面使用标识符HTTP IRI方案,称为“HTTP IRIs”。除了全局唯一之外,这样的标识符还具有使用广泛实现的协议可解引用的优点。因此,可以实现HTTP iri,以便最终用户可以使用传统的web浏览器获取有关资源的信息。还可以实现HTTP IRIs,这样语义客户机就可以发现描述资源的数据(RDF形式)。由于认识到HTTP iri所赋予的优点,该TDWG GUID适用性声明标准在建议2中指定“必须为非自解析guid提供HTTP GET解析”。因此,打算通过RDF提供数据的生物多样性信息提供者应该计划实现持久化HTTP iri的guid。这并不排除其他形式的非自解析全局唯一标识符,这些标识符可以使用中描述的方法与HTTP IRI关联第二节本指南。

1.4 RDF术语的使用

1.4.1熟知词汇(非规范性词汇)

因为RDF假设数据提供者和使用者之间没有预先存在关于用作描述资源的属性的术语的协议,所以如果提供者使用来自众所周知的词汇表的术语,那么消费客户机“理解”RDF三元组含义的可能性就会增加。列出了一些众所周知的通用词汇和生物多样性相关词汇RDF初学者指南简介.如果没有已知的术语来表示描述资源所需的属性,数据提供者可能会“制造”自己的术语。在这种情况下,提供者应该为术语分配IRI,用RDF定义术语,提供清晰的、人类可以理解的关于术语应该如何使用的文档,提供IRI的解引用,并致力于术语IRI和定义的长期稳定性。

1.4.2恰当使用术语(规范性)

由于RDF面向机器的特性,提供者必须假定消费客户机不会从语句中推断出任何意义,除非是直接陈述的内容,或者可以从关于语句中涉及的资源和术语的其他语句中逻辑推断出的内容。例如,提供程序可能在三元组中使用资源的名称,目的是让名称代表资源本身。但是,如果在三元组中用作谓词的术语被设计为引用资源本身而不是资源的名称,则客户机可能无法在名称和资源本身之间建立连接。根据术语的定义方式,客户端可能检测到不一致或得出如下所述的意外结论。不恰当地将术语用作RDF谓词可能会产生意想不到的后果,因为与基于文本的数据传输协议不同,RDF被设计成允许客户端根据术语定义中包含的信息推断附加事实。例如,术语的定义foaf:描述包含声明其域为的语句foaf:形象.类描述资源的提供程序foaf:描述属性还隐式(可能是在不知情的情况下)将资源声明为图像。术语是用一种RDF形式定义的网络本体语言(OWL)可能会被限制使用。例如,将一项声明为an猫头鹰:ObjectProperty表示该属性的值是一个字符串文字(即,该值应该是一个IRI)是不一致的。

由于这些原因,只有在数据提供者仔细检查了与定义该术语的词汇表或本体相关的文档和使用指南,并确定该术语的使用与提供者打算向其中将该术语用作谓词的三元组传递的含义一致之后,术语才应该在RDF中用作谓词。

有关在RDF中使用具有范围、域和子属性声明的术语的含义的详细信息,请参见RDF初学者指南的第4部分.有关如何使用OWL定义RDF术语的复杂属性的详细信息,请参见RDF初学者指南的第7部分

1.4.3在RDF中使用达尔文核心术语(规范性)

一般的达尔文核心词汇,其术语在dwc:名称空间(http://rs.tdwg.org/dwc/terms/),主要是为了方便从相对“平坦”的数据库表传输基于文本的记录。正因为如此,与一般词汇表相关的术语推荐建议使用文本字符串来指代物理和概念实体,即,名称表示人,引用表示文章,代码表示机构,等等(文本字符串的几种类型的角色将在1.5节)。当一条记录的一个属性有多个值时,一般的Darwin Core术语定义建议将多个字符串连接起来并在单个字段中描述,以避免强制创建更规范化的数据结构。

然而,在RDF中,物理实体和概念实体的识别通常是通过IRI引用而不是文本来完成的。如果一个属性有多个值,每个值都应该在一个单独的三元组中引用。因此,我们面临这样一种情况:在RDF上下文中,需要用一个到多个具有非文字(IRI引用)对象的三元组来表示某些DwC属性,而在表示这些属性的一般DwC词汇表中,术语的实际定义指定提供单个文字(文本字符串)对象。

在理想的情况下,所有希望提供RDF服务的数据提供者都将立即用IRI guid替换对物理和概念资源(名称、引用、代码等)的文字引用,IRI guid标识这些资源并被社区的其他成员重用。然而,更现实的假设是,至少在最初,许多提供程序将只有很少(如果有的话)的guid可用来作为IRI引用,因此要求IRI专门引用非文字资源将阻碍以RDF形式公开数据。因此,在提供提供者无法将其现有(字符串)数据库字段转换为IRI引用的情况下,继续对文字对象使用通用DwC术语,同时提供一组可供在RDF中与IRI引用对象一起使用的DwC术语将是有利的。

本指南介绍命名空间dwciri:http://rs.tdwg.org/dwc/iri/),其术语用于非文字对象。如果一项在dwciri:命名空间在dwc:具有相同本地名称的命名空间dwciri:Term和its有相同的意思dwc:同行。例如,dwciri: recordedBy意思和dwc: recordedBy,而是作为RDF谓词dwciri: recordedBy是可重复的,并且有一个iri引用对象。数据库包含该字段的提供者dwc: recordedBy使用包含连接的名称列表的记录,可以立即将这些值作为单个RDF三元组发布dwc: recordedBy作为谓词,并包含一个字面值对象,即连接的列表字符串。通过这种方式,可以立即开始以RDF形式发布数据dwc:而不要求每个资源都有一个指定的IRI GUID。随着社区开发用于发现和重用IRIs的机制,数据提供者可以将其转换为dwciri:条款。作为数据更新和清理过程的一部分,提供者或聚合器可能最终会解析字符串,搜索社区IRI存储库,并将字符串与现有的IRI进行匹配,或者在不存在的情况下创建新的IRI。

1.4.4本指南的局限性(非规范性)

本指南提供了关于如何将Darwin Core属性术语用作RDF谓词的一般指导,并指定了应该在何处使用Darwin Core类术语rdf: type声明(2.3.1.5节).然而,Darwin Core标准并没有精确地指定应该将哪些资源作为其类的实例包含,也没有为其属性术语声明域。虽然达尔文核心快速参考指南通过在类标题下组织这些属性术语来建议哪些属性可以应用于类的实例,Darwin Core将关于类型声明和属性赋值的具体决定留给社区共识。的示例中提供了一些演示向Darwin Core类分配资源并将它们与在Darwin Core之外定义的对象属性连接的不同方法的示例达尔文核心信息辅助网页

1.5文本字符串作为dwc: namespace中属性值的作用(非规范)

当人类用书面语言交流时,他们使用字符串的文本字符来传递含义。在某些情况下,文本字符串可能具有相对明确的含义。然而,在许多情况下,文本字符串的确切含义取决于使用它的上下文。以文本字符串“german”为例。该字符串可能是指以某些商定的地理边界为界的位置。它可能是指一个政治实体,即“德国的政府”。它可能是指一个实体,包括生活在某些地理边界上的所有居民。它也可能是用某种语言记录的名称。" german "和" Deutschland "一样吗?" german "和" DE "是一个意思吗? Is “Germany” the same as “Federal Republic of Germany”? The answers to all of these questions depends on what one means by “Germany”.

在基于文本的数据传输系统中,文本字符串是信息传递的主要手段。将现有的基于Darwin Core文本的数据简单地“翻译”为RDF是一件相对简单的事情,方法是使每个字符串值都是一个谓词(即Darwin Core属性)的文字对象。但这不会导致RDF传递RDF设计要传递的那种“含义”。

因为基于文本的系统依赖于对数据字段含义的预先确定的理解,所以用户不需要仔细考虑字符串值要发挥的作用。然而,在RDF中,当提供字符串时,不能假定客户机“知道我的意思是什么”。方法中为Darwin Core属性提供字符串值时,有必要研究我们想要的各种含义dwc:名称空间。

1.5.1字符串是编码资源的标准方法的情况(非规范)

数字、日期和标题本质上是概念性的资源,但它们的含义可以通过字符串完全而简洁地传递。如果为字符串指定了数据类型编码方案,或者使用了语言属性来指示标题的语言,则尤其如此。在这种情况下,除了字符串本身之外,几乎不需要提供关于资源的附加信息。字面对象本身就是充分的。

1.5.2字符串值作为非信息资源的代理的情况(不规范)

人们通常使用名称字符串来表示物理或概念(即非信息)资源。例如,字符串“Vincent van Gogh”被用来代表名字是Vincent van Gogh的人。如果我们说“星夜”是由“文森特·梵高”创作的,我们就不是说“星夜”是由“文森特·梵高”这个名字创作的,而是说“星夜”是由一个叫文森特·梵高的人创作的。就这一点而言,“星空”是一幅画的名字,我们实际上可能是指创作这幅画的人,而不是这幅画的名字(尽管这两幅画很可能都是他创作的!)与第一种情况不同,这样的名称字符串本身并不包含人们可能想知道的关于非信息资源的几乎所有信息(例如,创建日期、在某段时间内的位置等),但它们可以作为资源的标识符。在RDF中,比起字符串名,机器可处理的iri更适合作为资源的标识符。

1.5.3字符串值作为关键字进行搜索的情况(非规范)

想象一下,一个人把一棵橡树识别为“栎木”。与该标识相关联的数据可以提供属性/值对dwc: scientificName“Quercus阿尔巴”.这意味着此人断言这棵树是与该名称相关的一个分类单元的代表Quercus阿尔巴.与标识相关联的数据还可以提供属性/值对dwc:订单“山毛榉目”.有人可能会认为,这意味着断言这棵树的身份的人也断言这棵树属于Fagales目。然而,这个人很可能并没有做出这样的断言,事实上,他甚至可能从未听说过法加莱斯骑士团。相反,订阅特定分类层次结构的数据库管理器断言所有具有dwc: scientificName值的“Quercus alba”也应该有一个属性/值对dwc:订单“山毛榉目,以允许数据库的用户搜索相关的身份,因为他们有共同的价值dwc:订单财产。

关键是,为了更准确地描述真实情况,应该有两组独立的信息:一组断言此人将这棵树识别为一个分类单元的代表,该分类单元的学名是“栎木”(Quercus alba);另一组断言该分类单元与更高的分类单元之间的关系,例如一个被称为“Fagales”的分类单元。

1.5.4字符串值作为标识符的情况(不规范)

许多Darwin Core属性指定它们的值应该是一个标识符。在使用这些属性时存在明显的歧义,因为根据情况,值可能是主题资源本身的标识符,也可能是与主题资源以某种方式相关的资源的标识符。此外,Darwin Core有时推荐(但不要求)一个GUID作为值,但不要求GUID是HTTP IRI或一般的IRI。

1.5.5将Darwin Core字符串值表示为RDF的含义(非规范)

为了方便实现RDF所实现的清晰性,本指南为这四种提供字符串值的情况提供了不同的方法。在前三种情况下,现有的术语来自Darwin Core命名空间dwc:可与文字值一起使用,以公开当前存在于基于文本的数据库中的字符串值。这允许快速部署3节在第一种情况下(1.5.1节).在第二种情况下(1.5.2节)、现有的类似物dwc:已创建的术语dwciri:命名空间,它打算与iri引用而不是名称一起使用。在第三种情况下(1.5.3节),新dwciri:已经创建了术语来将主题资源与构成层次结构一部分的iri识别的对象资源关联起来。如果这样的层次结构已经存在,则不需要使用将主题资源与层次结构的所有部分关联起来的单独术语(“方便术语”),尽管如果方便字符串搜索,仍然可以使用这些术语。最后一种情况(1.5.4节)更加复杂,实现指南的一个重要部分专门讨论了RDF应该如何结构化以处理各种标识符。

2实施指南

2.1定义

2.1.1本文档中XML限定名(qname)中使用的命名空间缩写(非规范性)

表1

词汇表的名字 名称缩写 完整的前缀
资源描述框架 rdf: http://www.w3.org/1999/02/22-rdf-syntax-ns#
RDF Schema rdfs: http://www.w3.org/2000/01/rdf-schema#
XML模式 xsd: http://www.w3.org/2001/XMLSchema#
Web本体语言 猫头鹰: http://www.w3.org/2002/07/owl#
Darwin核心术语(字符串字面对象) dwc: http://rs.tdwg.org/dwc/terms/
达尔文核心术语(IRI引用对象) dwciri: http://rs.tdwg.org/dwc/iri/
都柏林核心条款 使用dc: http://purl.org/dc/terms/
都柏林核心遗留条款 dc: http://purl.org/dc/elements/1.1/
都柏林核心型词汇 dcmitype: http://purl.org/dc/dcmitype/
FOAF词汇表 foaf: http://xmlns.com/foaf/0.1/
DBpedia资源 dbre: http://dbpedia.org/resource/
GeoNames本体 gn: http://www.geonames.org/ontology#
地质时标模型本体 gsml: http://resource.geosciml.org/ontology/timescale/gts-30#
虚拟国际权威文件 控制号: http://viaf.org/viaf/
可扩展元数据平台权限管理词汇表 xmpRights: http://ns.adobe.com/xap/1.0/rights/

为了简单起见,这些示例不包括名称空间声明,也不包括rdf: rdf容器元素。中定义的容器元素中,如果用户希望测试或验证示例,请将其插入2.1.2节

2.1.2为示例生成图形图和三表(非规范性)

W3C RDF验证服务可以用来生成示例XML序列化中包含的三元组的列表列表和图形关系图。示例中的文本可以放在rdf: rdf容器元素,然后粘贴到验证器框中以生成所需的输出。

<?xml version = " 1.0 " encoding = " utf - 8 " ?>< rdf: rdfxmlns: rdf =“http://www.w3.org/1999/02/22-rdf-syntax-ns”xmlns: rdfs =“http://www.w3.org/2000/01/rdf-schema”xmlns: xsd =“http://www.w3.org/2001/XMLSchema”xmlns:猫头鹰=“http://www.w3.org/2002/07/owl”xmlns: dwc =“http://rs.tdwg.org/dwc/terms/”xmlns: dwciri =“http://rs.tdwg.org/dwc/iri/”xmlns:使用dc =“http://purl.org/dc/terms/”xmlns: dc =“http://purl.org/dc/elements/1.1/”xmlns: dcmitype =“http://purl.org/dc/dcmitype/”xmlns: foaf =“http://xmlns.com/foaf/0.1/”xmlns: dbre =“http://dbpedia.org/resource/”xmlns: gn =“http://www.geonames.org/ontology”xmlns: gsml =“http://resource.geosciml.org/ontology/timescale/gts-30”xmlns:控制=“http://viaf.org/viaf/”>资源描述在这里…< / rdf: rdf >

2.1.3术语(非规范化)

“资源”是可以使用RDF描述的任何类型的实体的通用术语。资源可以是物理实体、概念实体或数字实体。关于资源的语句以RDF的形式编写“三元组”.三元组由主语、谓语和宾语组成:

表2

主题 谓词 对象
http://dbpedia.org/resource/Starry_night http://xmlns.com/foaf/0.1/maker http://viaf.org/viaf/9854560
dbre: Starry_night foaf:制造商 控制号:9854560

在表2的第二行中,给出了完整的iri。在第三行中,使用名称空间缩写来缩短IRIs。下面的RDF片段显示了RDF/XML格式的三元组,以及表2所示三元组的Turtle序列化:

示例1:

RDF / XML

< rdf:描述rdf: about =“http://dbpedia.org/resource/Starry_night”>< foaf:制造商rdf: resource =“http://viaf.org/viaf/9854560”/>> < / rdf:描述

乌龟

< http://dbpedia.org/resource/Starry_night >foaf:制造商< http://viaf.org/viaf/9854560 >

都柏林核心元数据计划(DCMI)抽象模型它使用属性-值对描述主题资源,属性-值对对应于谓词和对象对。当提到都柏林核心术语(以及以都柏林核心为模型的达尔文核心)时,“属性”与“谓词”同义,“价值”与“对象”同义。在例1中,foaf:制造商是一种财产控制号:9854560与该属性关联的值。谓词必须由IRIs识别。三元组的对象可以通过三种方式识别:1)对象资源可以通过IRI引用识别;2)对象可以通过非IRI字符串识别,在这种情况下,它被称为文字;3)对象资源也可以保持未识别状态,在这种情况下,它被称为空节点或匿名节点。如果其他数据提供程序能够引用它们所表示的资源是非常重要的,则不需要空节点。但是,如果对资源的外部引用不相关,或者如果数据提供者不能或不愿意提供稳定的IRI来标识资源,那么空节点可能更可取。IRI引用和空节点可以成为RDF三元组的主题,但文字不能。

2.2学科资源(规范性)

如果RDF三元组的主题被识别(即,不是匿名节点),那么它必须由IRI引用。本节描述如何在RDF中引用IRI标识符,以及如何将非IRI标识符与三元组的主题关联起来。

2.2.1使用IRIs识别主题资源(规范)

rdf: about的属性rdf:描述元素在RDF/XML中用于识别三元组的主题:

< rdf:描述rdf: about =“http://arctos.database.museum/guid/MVZ: Mamm: 165861”>

2.2.2将字符串标识符与主题资源关联(规范)

都柏林核心术语使用dc:标识符应该用来将字符串文字标识符(例如,UUID,“Darwin Core Triplet”,或ARK)与iri识别的资源相关联,如RDF/XML中所示:

<使用dc:标识符>58 d31d52 - 713 d - 44 - b4 - 9 - fe9 cb2d9249c422> < /使用dc:标识符
<使用dc:标识符> MVZ: Mamm: 165861 > < /使用dc:标识符
<使用dc:标识符>方舟:/ 12025/654xz321> < /使用dc:标识符

如果HTTP IRI被认为是主题资源的标识符,则可以将其表示为的字符串文字值使用dc:标识符除了使用它在rdf: about属性,如例2所示:

示例2:

< rdf:描述rdf: about =“http://bioimages.vanderbilt.edu/kirchoff/b5161”>< rdf: typerdf: resource =“http://purl.org/dc/dcmitype/StillImage”/><使用dc:标识符>http://bioimages.vanderbilt.edu/kirchoff/b5161> < /使用dc:标识符> < / rdf:描述

2.2.3将URN与其http代理的对等物相关联(规范)

TDWG LSID适用性声明标准在建议30中指定了“由LSID标识的所有对象的描述必须包含一个猫头鹰:不同猫头鹰:equivalentProperty猫头鹰:equivalentClass表示标准形式的对象标识符与其代理版本之间等价的语句”。例3说明了这一点:

示例3:

RDF / XML

< rdf:描述rdf: about =“http://biocol.org/urn: lsid biocol.org:上校:35115”><猫头鹰:不同rdf: resource =“urn: lsid biocol.org:上校:35115”/>> < / rdf:描述

乌龟

< http://biocol.org/urn: lsid biocol.org:上校:35115 >猫头鹰:< urn: lsid biocol.org:上校:35115 >

因为lsid遵循URN IRI方案,所以它们可以作为任何RDF三元组的主题。但是,最好使用http代理的表单作为主题(即rdf: about属性)。看到达尔文核心信息辅助网页参阅有关实现lsid的更多信息。

这种实践可以扩展到任何URN。例如,猫头鹰:不同可以用来关联URN< urn: uuid: f81d4fae-7dec-11d0-a765-00a0c91e6bf6 >到它的http代理等价物< http://provider.org/f81d4fae-7dec-11d0-a765-00a0c91e6bf6 >以类似于例3的方式。

2.3谓词(规范)

达尔文核心词汇表中的大多数术语都可以作为三元组中的谓词来表示主题资源的属性。必须使用完整的术语IRI,尽管通过适当的名称空间声明,名称空间可以缩写为(2.1.1节).RDF不限制谓词的来源,因此Darwin Core术语可以与来自其他词汇表的术语混合使用。这包括重要的谓词rdf: type它用于指示主题资源是其实例的类。RDF中并没有禁止重复属性。

2.3.1声明资源类型(非规范性)

在RDF中,可以通过声明资源是类的实例来描述资源。指出资源是类的实例有几个好处。它允许使用者通过将搜索限制到某些类型的资源来缩小搜索结果。它向数据提供者建议应该使用什么类型的属性来描述资源。它允许使用者预测他们可能希望为该资源提供何种类型的属性,并允许开发人员构建利用这些预期的应用程序。由于这些好处,RDF提供了几种断言类成员关系的内置机制,最显著的是rdf: type财产它用于声明资源是类的实例。没有任何东西禁止分配多个rdf: type属性设置为资源。事实上,将一个资源描述为两个类的成员可能会有好处,一个类在一个狭窄的社区中具有特定的含义,另一个类更知名,具有更广泛的含义,因此更容易被一般客户理解。例如,一个资源可以被类型为dwc: PreservedSpecimen和一个dcmitype: PhysicalObject

2.3.1.1 rdf:类型语句(规范性)

谓词rdf: type定义为具有一个类对象。类应该通过IRI引用(而不是文字)来标识,如例4所示:

示例4:

RDF / XML

< rdf:描述rdf: about =“http://bioimages.vanderbilt.edu/baskauf/12226”>< rdf: typerdf: resource =“http://purl.org/dc/dcmitype/StillImage”/><使用dc:创建rdf:数据类型=“http://www.w3.org/2001/XMLSchema dateTime”>2002 - 06 - 11 - t09:37:33> < /使用dc:创建> < / rdf:描述

乌龟:

< http://bioimages.vanderbilt.edu/baskauf/12226 >一个dcmitype:StillImage使用dc:创建“2002 - 06 - 11 t09:37:33”^ ^xsd:dateTime

在海龟序列化,rdf: type可以缩写为"一个(例4)。在XML序列化中,RDF规范提供了一种简短的方法来指定所描述资源的类型。这个方法叫做输入节点元素.的rdf:描述元素被一个元素替换,该元素的名称是一个XML限定名,该限定名标识了一个类,所描述的资源是其中的一个实例,如例5所示:

例5:

< dcmitype: StillImagerdf: about =“http://bioimages.vanderbilt.edu/baskauf/12226”><使用dc:创建rdf:数据类型=“http://www.w3.org/2001/XMLSchema dateTime”>2002 - 06 - 11 - t09:37:33> < /使用dc:创建< / dcmitype: StillImage >

这个示例序列化了与示例4完全相同的两个三元组。的rdf: typeTriple是由容器元素名隐含的。

2.3.1.2 rdf:通过域和范围声明的类型断言(规范)

RDF模式(RDFS)规范定义断言的两个术语rdf: type当使用某些谓词时是隐式的。当一个谓词P有财产

C P rdfs:域

是用来描述一个主题资源的,客户端可以推断这个主题资源是一个类的实例吗C.例如,术语使用dc: bibliographicCitation被分配了属性

< rdfs:域rdf: resource =“http://purl.org/dc/terms/BibliographicResource”/>

在它的定义。如果这个术语被用来表示标本的属性,客户就可以推断标本具有rdf: type使用dc: BibliographicResource

例6:

RDF / XML

< rdf:描述rdf: about =“http://arctos.database.museum/guid/MVZ: Mamm: 165861”><使用dc: bibliographicCitation >栉虫(MVZ 165861)< /使用dc: bibliographicCitation >> < / rdf:描述

乌龟

< http://arctos.database.museum/guid/MVZ: Mamm: 165861 >使用dc:bibliographicCitation"Ctenomys sociabilis (MVZ 165861)"

当一个谓词P有财产

C P rdfs:范围

是否与值一起使用,客户端可以推断该值是类的实例C.这个词使用dc:语言被分配了属性

< rdfs:范围rdf: resource =“http://purl.org/dc/terms/LinguisticSystem”/>

在它的定义。如果RDF三元组中该术语的对象是对由MARC ISO 639-2语言名称表示规范(例7),则可以推断出< http://id.loc.gov/vocabulary/iso639-2/eng >是一个使用dc: LingisticSystem尽管RDF中的MARC描述并没有在其定义中直接断言这一点。

例7:

RDF / XML

< rdf:描述rdf: about =“http://dx.doi.org/10.5962/bhl.title.59991”><使用dc:语言rdf: resource =“http://id.loc.gov/vocabulary/iso639-2/eng”/>> < / rdf:描述

乌龟

< http://dx.doi.org/10.5962/bhl.title.59991 >使用dc:语言< http://id.loc.gov/vocabulary/iso639-2/eng >

在Darwin Core命名空间中定义的术语都没有范围或域声明。然而,从都柏林核心导入达尔文核心的一些术语确实有域或范围声明。部分3.2而且3.3当断言这些术语时,本指南给出了声明的范围和域。

2.3.1.3显式类型声明与推断类型声明(规范)

因为使用具有范围或域声明的谓词意味着rdf: type对于资源,数据提供者应该在以非标准方式使用任何此类术语时保持谨慎。例如,如果属性foaf: familyName与标本一起使用(例如,表示分类科),则暗示该标本是foaf:人.但是,不能假设所有客户端都将执行推断所需的推理rdf: type由范围和域声明隐含的声明。因此,如果数据提供程序认为让使用者知道资源是特定类的实例很重要,则提供程序应该使用显式的rdf: type即使断言了可以从域或范围声明中推断出的相同信息,也是三重的。例如,如果图像的提供者希望确保在资源的查询中找到图像rdf: typefoaf:形象,他们不应该假设使用属性描述图像foaf:描述会因为范围的声明而完成吗foaf:描述.把它包括进来会更安全

< rdf: typerdf: resource =“http://xmlns.com/foaf/0.1/Image”/>

在图像的描述中。事实上,提供者可能也希望包含

< rdf: typerdf: resource =“http://purl.org/dc/dcmitype/StillImage”/>

在描述中,使客户端搜索实例foaf:形象dcmitype: StillImage类资源会找到图像。

2.3.1.4用于表示类型(规范性)的其他谓词

都柏林核心和达尔文核心都定义了可以用来描述资源性质的术语:使用dc:类型而且dwc: basisOfRecord分别。但是,使用这些术语来描述主题资源的性质并不能代替使用的rdf: type.的DCMI对RDF语义的说明建议“实现此规范的应用程序主要使用并理解rdf: type在的地方使用dc:类型当用RDF表达Dublin Core元数据时,大多数RDF处理器都自带的知识rdf: type的使用也可以得到类似的论证rdf: typedwc: basisOfRecord.包括dc:类型使用dc:类型,dwc: basisOfRecord应该被认为是可选的,而包括rdf: type应该被认为是强烈推荐的。一个dwciri:模拟(2.5节)dwc: basisOfRecord不应使用。使用rdf: type而当对象是IRI引用时。下面是一个示例,该示例使用了几个明确定义资源性质的术语(包括多个)来描述一个样本rdf: type声明:

例8:

RDF / XML

< rdf:描述rdf: about =“http://arctos.database.museum/guid/MVZ: Mamm: 165861”>< rdf: typerdf: resource =“http://rs.tdwg.org/dwc/terms/PreservedSpecimen”/>< rdf: typerdf: resource =“http://purl.org/dc/dcmitype/PhysicalObject”/>< dc: type >PhysicalObject< / dc:类型><使用dc:类型rdf: resource =“http://purl.org/dc/dcmitype/PhysicalObject”/>< dwc: basisOfRecord >PreservedSpecimen< / dwc: basisOfRecord >> < / rdf:描述

乌龟

< http://arctos.database.museum/guid/MVZ: Mamm: 165861 >一个dwc:PreservedSpecimen,dcmitype:PhysicalObjectdc:类型“PhysicalObject”使用dc:类型dcmitype:PhysicalObjectdwc:basisOfRecord“PreservedSpecimen”

2.4.3部分而且2.5的术语之间的区别的解释dc:使用dc:dwc:,dwciri:名称空间。

2.3.1.5类将用于使用Darwin Core描述的资源的类型声明(规范性)

TDWG GUID适用性声明标准指定由GUID识别的生物多样性领域中的对象应该使用众所周知的词汇表进行键入。考虑到这一建议,应该将提供关于以IRI形式分配了持久标识符的任何资源的类型(即类成员)的信息视为最佳实践。由于Darwin Core是一个众所周知的词汇表和已批准的TDWG标准,因此它的类应该优先用于输入,而不是TDWG本体中未批准标准和实际上已弃用的部分中的类。Darwin核心类的可读定义为决定分配给资源的类型提供了指导,尽管对一些更复杂的资源类型进行分类可能需要社区的一致意见。(1.4.4节

任何Darwin Core类IRI都可以用作值rdf: type虽然还不清楚是否dwc: ResourceRelationship实例在RDF上下文中是有意义的。以下列表总结了包含在都柏林核心类型词汇表(但不属于达尔文核心)中的类,这些类也应用于生物多样性相关资源的分类:

dcmitype: StillImage
dcmitype: MovingImage
dcmitype:声音
dcmitype: PhysicalObject

2.4对象资源(非规范性)

1.3.1节本指南导论部分的介绍说明了RDF三元组的对象如何可以表示为字符串文字或IRI引用。也可以有IRI没有标识的非文字对象。这些节点称为空节点或匿名节点。本节描述如何用这三种形式来表示对象。3节而且1.5节的介绍解释了将值作为字符串字面量(例如,名称、引用和代码)用作非字面量资源的代理的数据公开所涉及的问题。本节还讨论了表示RDF等数据的策略。

2.4.1文字对象资源(规范性)

有些资源(如标题、日期和数字)可以本质上表示为字符串。在合适的情况下,三元组的对象是字符串,在RDF/XML中,字符串被放置在限定名为属性的容器元素中:

< dwc: catalogNumber >s1987 - 00397< / dwc: catalogNumber >
2.4.1.1类型化字面量(规范的)

因为字面量不能成为RDF三元组的主题,所以不可能在RDF中广泛地描述字面量的属性。但是,为文字指定数据类型IRI提供了一种机制,允许客户端解释字符串所表示的资源的性质。(见1.1 RDF语义RDF 1.1 XML语法文档细节。)

rdf datatype属性指示字符串符合将字符串映射到其抽象值的特定格式(整数、日期等)。

例9:

RDF / XML

< rdf:描述rdf: about =“http://bioimages.vanderbilt.edu/hessd/e5240 loc”>< rdf: typerdf: resource =“http://purl.org/dc/terms/Location”/>< dwc: decimalLatituderdf:数据类型=“http://www.w3.org/2001/XMLSchema小数”>35.857959< / dwc: decimalLatitude >< dwc: decimalLongituderdf:数据类型=“http://www.w3.org/2001/XMLSchema小数”>-86.298055< / dwc: decimalLongitude >< dwc: coordinateUncertaintyInMetersrdf:数据类型=“http://www.w3.org/2001/XMLSchema int”>20.< / dwc: coordinateUncertaintyInMeters >> < / rdf:描述

乌龟

< http://bioimages.vanderbilt.edu/hessd/e5240 loc >一个使用dc:位置dwc:decimalLatitude“35.857959”^ ^xsd:小数dwc:decimalLongitude“-86.298055”^ ^xsd:小数dwc:coordinateUncertaintyInMeters“20”^ ^xsd:int

如果字符串用特定语言表示信息,则提供程序应包含xml: lang属性来指示字符串的语言RFC 4646语言代码的语言。除了指定字符串的语言之外,提供语言标记还要求所描述的资源具有该类型rdf: langString

例10:

RDF / XML

< rdf:描述rdf: about =“http://dx.doi.org/10.1525/auk.2009.09022”><使用dc: bibliographicCitationxml: lang =“en”>S. Claramunt等人。2009。弯曲菌属的多植性及其一新属的描述。Awk 127(2): 430 - 439。< /使用dc: bibliographicCitation ><使用dc: bibliographicCitationxml: lang =“西文”>S. Claramunt等人。2009。Campylorhamphus y la Descripción de un Nuevo Género para C. pucherani (Dendrocolaptinae)。Awk 127(2): 430 - 439。< /使用dc: bibliographicCitation >> < / rdf:描述

乌龟

< http://dx.doi.org/10.1525/auk.2009.09022 >使用dc:bibliographicCitationS. Claramunt, et al. 2009。弯曲菌属的多植性及其一新属的描述。Awk 127(2): 430 - 439。”@enS. Claramunt, et al. 2009。Campylorhamphus y la Descripción de un Nuevo Género para C. pucherani (Dendrocolaptinae)。Awk 127(2): 430 - 439。”@

1.1 RDF语义规范中,包含数据类型d是对基本RDF的直接扩展。的该规范中的蕴涵规则确定没有显式数据类型属性或语言标记的字面量具有隐式数据类型xsd: string.这也需要rdf: type的字面量xsd: string.这样做的实际含义是,不带数据类型属性或语言标记的公开文字应该被客户机解释为字符序列,而不是其他抽象或非信息资源(人类可能解释字符序列来表示)。这具有实际意义2.4.3节(其中无类型文字是用于表示非文字资源的值字符串)和2.7节(其中非类型化字面量为促进基于字符串的搜索提供了一种方便的方法)。尽管许多提供者最初可能会选择公开不带数据类型属性的字面量,但他们应该逐渐用uri或数据类型字面量来替换这些字面量,这些uri或数据类型字面量准确地表示非类型化字面量要表示的资源的类型和属性。

3.4节指示哪些Darwin Core术语适合用于具有数据类型或语言属性的值。

2.4.1.2用于文字对象的术语(规范性)

一些术语的定义清楚地表明,它们应该与字面对象一起使用。Darwin Core专门“进口”了几种都柏林核心条款用它的词汇来描述生物多样性数据。在某些情况下,术语使用dc:命名空间的范围声明rdfs:文字和因此被理解为用于文字对象(字符串)。在某些词汇表中,某些术语需要具有字面对象,因为在它们的定义中它们被声明为猫头鹰:数据类型属性。在达尔文核心的例子中dwc:http://rs.tdwg.org/dwc/terms/)命名空间中,RDF中的规范术语定义不包括任何声明,表明术语应该与文字引用对象或IRI引用对象一起使用。(例外是各种与日期相关的术语,它们继承了范围rdfs:文字因为他们是rdfs: subPropertyOf使用dc:日期)。然而,因为dwc:术语最初是为适应文本和XML数据传输而设计的,它们的定义通常指定了术语值应该如何表示为字符串字面量。本指南建立了在dwc:名称空间应该限制为与文字对象一起使用,以便在RDF中使用它们将与它们的定义一致。讨论了在3节而且2.5节,本指南介绍了一个单独的名称空间http://rs.tdwg.org/dwc/iri/(缩写为dwciri:),以获取其他的Darwin Core术语,这些术语旨在拥有IRI引用的对象。

2.4.2非文字对象资源(规范性)

物理的或概念性的资源通常不能内在地表示为字符串字面量,如果标识出来,则由IRIs以RDF引用。数字资源(例如,图像、网页等)可以表示为文字(资源的编码内容),但因为这样做需要许多字符,所以它们通常通过IRIs作为独立实体引用。在RDF/XML中,可以使用属性生成对非文字对象的IRI引用rdf:资源在空XML元素中:

<使用dc:权力rdf: resource =“http://biocol.org/urn: lsid biocol.org:上校:15666”/>

在来自另一个提供者的数据中,可以在同一文档中找到引用的非文字对象的描述,也可以没有该对象的描述。如果RDF文档将描述非文字的、iri标识的资源的进一步属性,那么这些属性可以放在rdf:描述具有rdf: about属性的值为资源的IRI:

例11:

<使用dc:权力>< rdf:描述rdf: about =“http://biocol.org/urn: lsid biocol.org:上校:15666”><使用dc:标识符>前苏联> < /使用dc:标识符> < / rdf:描述<使用dc:权力>

如果非文字对象没有被IRI识别(即,它是一个空节点),它的属性可以放在rdf:描述没有的容器元素rdf: about属性,它本身在属性的容器元素中:

例12:

<使用dc:权力>< rdf:描述><使用dc:名称xml: lang =“en”>拉沃尼亚大学的理事们< /使用dc:名称>> < / rdf:描述<使用dc:权力>
2.4.2.1非文字对象资源何时应该在同一文档中描述?(非规范化)

在引用资源的同一文档中描述资源有积极的一面也有消极的一面。如果IRI是不可解引用的,要么是因为IRI不是可以被HTTP解引用的类型(例如URN),要么是因为IRI的发布者暂时或永久地无法响应HTTP调用,那么在引用文档中提供关于资源的最小信息可能是有益的。例如,如果一个属性引用一本有ISBN但没有HTTP IRI的印刷书籍,如下:

例13:

< rdf:描述rdf: about =“http://bioimages.vanderbilt.edu/taxon/30148-gleason1991”><使用dc:引用rdf: resource =“urn: isbn: 0893273651”/>> < / rdf:描述

提供基本发布数据的描述,例如:

例14:

< rdf:描述rdf: about =“urn: isbn: 0893273651”>< rdf: typerdf: resource =“http://xmlns.com/foaf/0.1/Document”/><使用dc:日期rdf:数据类型=“http://www.w3.org/2001/XMLSchema # gYear”>1991> < /使用dc:日期<使用dc:名称xml: lang =“en”>美国东北部及邻近加拿大维管植物手册< /使用dc:名称>< dc:创造者>格里森,亨利·a·和亚瑟·克朗奎斯特< / dc:创造者>> < / rdf:描述

可纳入以统一标准编号形式引用国际标准编号的文件内。示例13和14中显示的RDF可以在Turtle中表示为:

< http://bioimages.vanderbilt.edu/taxon/30148-gleason1991 >使用dc:参考文献< urn: isbn: 0893273651 >< urn: isbn: 0893273651 >一个foaf:文档使用dc:日期“1991”^ ^xsd:gYear使用dc:标题美国东北部及邻近加拿大维管植物手册@endc:创造者"格里森,亨利·a·和亚瑟·克朗奎斯特"

但是,如果IRI引用的对象资源的数据是由另一个提供者主动管理的,那么引用文档中包含的任何数据都可能过时。在这种情况下,最好是简单地链接IRI,并让引用文档的使用者对IRI进行解引用,以检索关于对象资源的最新数据。在这个例子中:

例15:

RDF / XML

< rdf:描述rdf: about =“http://www.morphbank.net/?id=541608”>< rdf: typerdf: resource =“http://purl.org/dc/dcmitype/StillImage”/><使用dc:权力rdf: resource =“http://biocol.org/urn: lsid biocol.org:上校:15666”/>> < / rdf:描述

乌龟

< http://www.morphbank.net/?id=541608 >一个dcmitype:StillImage使用dc:情况下< http://biocol.org/urn: lsid biocol.org:上校:15666 >

权限持有人对象IRI由映像所有者以外的机构管理。该机构可随时更新与IRI相关的数据。因此,最好的办法可能是让消费者通过对IRI的解引用来检索关于版权所有者的数据。

2.4.2.1.1 lsid识别的对象(规范性)

在前面的示例中,HTTP IRI用作对象使用dc:权力属性是LSID的http代理形式。因为LSID是一个URN,因此也是IRI的一种类型,RDF规范不禁止将LSID用作IRI引用对象。然而,TDWG LSID适用性指南标准规定LSID不能用作RDF三元组的对象(建议31GUID适用性声明),因为客户端不一定能够解引用LSID来发现关于对象资源的附加信息。应该使用http代理版本的LSID(参见2.2.3节).看到达尔文核心信息辅助网页了解有关在RDF中使用lsid的更多信息。

2.4.2.2空白(匿名)节点(非规范)的对象

在大多数情况下,希望通过IRI引用非文字对象资源,因为省略IRI引用将不可能将外部引用与对象资源关联起来。以下示例:

示例16:

RDF / XML

< rdf:描述rdf: about =“http://museum.org/accession/12312”><使用dc: isReferencedBy >< rdf:描述>< rdf: typerdf: resource =“http://xmlns.com/foaf/0.1/Document”/><使用dc:日期rdf:数据类型=“http://www.w3.org/2001/XMLSchema # gYear”>2003> < /使用dc:日期<使用dc:名称xml: lang =“en”>收集的笔记< /使用dc:名称>< dc:创造者>乔馆长< / dc:创造者>> < / rdf:描述< /使用dc: isReferencedBy >> < / rdf:描述

乌龟

< http://museum.org/accession/12312 >使用dc:isReferencedBy一个foaf:文档使用dc:日期“2003”^ ^xsd:gYear使用dc:标题“收集笔记”@endc:创造者“乔馆长”]。

所述主题资源指的是未用IRI标识的对象资源,即用空节点表示的对象资源。从未识别资源的属性我们知道对象资源是一个foaf:文档2003年的“收藏笔记”,由Joe策展人创作。通过使用空节点表示资源,可以描述该资源的属性并将其与使用dc:引用属性,而不需要数据提供者为该资源创建IRI。数据提供者可能认为没有必要让另一个提供者引用该资源,或者提供者可能不愿意或无法为该资源维护单独的标识符。例如,在例12中,数据提供者可能没有为Lavonia大学的受托人访问IRI标识符的权限,并且可能对分配IRI标识符的工作不感兴趣。在未来的某个时刻,如果发现了Lavonia大学受托人的IRI,提供者可以用IRI引用替换空白节点。

2.4.3以前用文字表示但实际上是非文字资源的对象资源(非规范的)

在数据库中,实体的名称经常被用来表示实体本身。例如,一个人的名字经常被用作这个人的代表,或者一种语言的缩写已经被用来代表这种语言本身。在DCMI抽象模型创建之前,许多数据都是使用传统Dublin Core命名空间中的术语描述的dc:http://purl.org/dc/elements/1.1/)遵循了使用实体的名称来表示非文字实体的历史惯例。将此实践扩展到RDF将产生如下表示:

示例17:

RDF / XML

< rdf:描述rdf: about =“http://dbpedia.org/resource/Starry_night”>< dc:创造者>文森特·梵高< / dc:创造者>> < / rdf:描述

乌龟

< http://dbpedia.org/resource/Starry_night >dc:创造者“梵高”

然而,随着时间的推移,RDF用户社区已经开始认为区分字符串(如名称)和字符串所代表的内容是一种最佳实践使用Dublin Core Creator).为了区分字符串和它们所代表的资源,人们努力澄清特定的术语是应该用在文字对象中,还是用在IRI引用对象中。

2.4.3.1 Dublin Core中非文字资源的文字值(规范性)

介绍了DCMI抽象模型(DCAM)和后续使用指南RDF中的都柏林核心术语是为了澄清使用都柏林核心术语与文字和非文字对象.特别是,为术语声明了范围使用dc:名称空间(http://purl.org/dc/terms/),目的是澄清每个术语是打算与文字值或非文字值一起使用。例如,使用dc: bibliographicCitation有范围rdfs:文字,而使用dc:创造者有范围使用dc:代理.因为这个词使用dc:创造者有一个非文字范围,它应该与IRI引用的对象一起使用,如下例所示:

例18:

RDF / XML

< rdf:描述rdf: about =“http://dbpedia.org/resource/Starry_night”><使用dc:创造者rdf: resource =“http://viaf.org/viaf/9854560”/>> < / rdf:描述

乌龟

< http://dbpedia.org/resource/Starry_night >使用dc:创造者< http://viaf.org/viaf/9854560 >

都柏林核心RDF指南提供了一种使用术语的机制rdf:价值中允许遗留字符串文字数据与Dublin Core术语相关联使用dc:不打算与文字对象一起使用的名称空间。使用这种机制,非文字资源可以用一个空节点表示rdf:价值属性,其值为遗留字符串文字。这个值称为“值字符串”。然而,涉及到使用的机制rdf:价值作为一个谓词还没有被广泛实现。在那个时候使用dc:术语被定义了,术语在dc:命名空间没有范围声明。已经这样考虑过了在都柏林核心社区是可以接受的使用dc:具有遗留字符串字面量(即值字符串)的命名空间术语,如示例15所示。类中的术语可能使用了许多非rdf数据的提供者的文字值使用dc:具有非文字范围的命名空间。中的所有术语请注意使用dc:名称空间中具有相应的术语dc:命名空间(即具有相同本地名称的术语)最佳实践的食谱)宣布rdfs: subPropertyOf那些dc:名称空间方面.的非rdf数据库中包含术语的字符串值使用dc:具有非文字范围的名称空间,则适当将这些文字在RDF中作为对应的值公开dc:条款。

2.4.3.2 Darwin Core中非文字资源的文字值(规范性)

因为有许多由字符串值组成的遗留数据dwc:名称空间(http://rs.tdwg.org/dwc/terms/)的术语,这些术语的对象实际上表示非文字实体(例如,值字符串感知DCAM),很可能许多提供者至少在最初会以RDF形式公开这类数据,作为直接从其现有数据库提供的字符串文字,例如。R2RML.为了使遗留数据能够以RDF的形式公开,同时确保保留这些数据的含义,需要使用RDF来表示现有的Darwin Core术语的字面值dwc:命名空间应该具有与术语描述中描述的相同的结构,如例19所示。

例19:

RDF / XML

< rdf:描述rdf: about =“http://arctos.database.museum/guid/MVZ: Mamm: 115956”>< dwc: recordedBy >Oliver P. Pearson | Anita K. Pearson< / dwc: recordedBy >> < / rdf:描述

乌龟

< http://arctos.database.museum/guid/MVZ: Mamm: 115956 >dwc:recordedBy奥利弗·p·皮尔森|安妮塔·k·皮尔森

的条款dwc:命名空间不应该用于IRI引用对象,即使术语定义表明对象资源是非文字类型的。相反,IRI引用对象应该与中的术语一起使用dwciri:中定义的命名空间2.5节.对象的对象提供字符串值时dwc:名称空间术语,其定义建议对象为非文字类型,该字符串被理解为值字符串。

dwciri:命名空间中的术语(标准的)

名称空间中的术语dwciri:http://rs.tdwg.org/dwc/iri/)是用来与IRI引用对象一起使用的,不应该与字面对象一起使用。它们也可以与空白节点对象一起使用,尽管在大多数情况下这可能是不必要的。

2.5.1 dwciri的定义:术语(规范性)

如果一项在dwciri:命名空间有一个对应的术语本地名称dwc:名称空间,dwciri:命名空间术语定义为与其具有相同的含义dwc:名称空间模拟。在定义一个dwciri:有一个dwc:模拟的定义dwc:术语被理解为如下的修改方式:

  • 当一个dwciri:术语被用作RDF谓词,它的非文字对象将由IRI引用识别,而不是字符串文字
  • 的对象dwciri:术语谓词将是单个资源。如果dwc:术语定义指定多个值应该是一个连接的列表,资源由dwciri:属性应该是列表中每个值的三元组的主题。或者,如果对象是由使用附加RDF三元组描述的组件资源组成的单个资源,则可以使用单个三元组来描述主题。

有几个术语dwciri:命名空间没有dwc:名称空间类似物(dwciri: inCollectiondwciri: toTaxondwciri: inDescribedPlacedwciri: earliestGeochronologicalEradwciri: latestGeochronologicalEradwciri: fromLithostratigraphicUnit,dwciri: inDataset).它们的定义见3.6节

2.5.2在Darwin Core dwciri:命名空间中使用由IRI引用识别的非文字对象(非规范)

下面的例子展示了如果IRIs可用来识别姓名组成文字的人,示例19中的数据将如何表示:

例20:

RDF / XML

< rdf:描述rdf: about =“http://arctos.database.museum/guid/MVZ: Mamm: 115956”>< dwciri: recordedByrdf: resource =“http://viaf.org/viaf/263074474”/>< dwciri: recordedByrdf: resource =“http://museum-x.org/personnel/akp”/>> < / rdf:描述

乌龟

< http://arctos.database.museum/guid/MVZ: Mamm: 115956 >dwciri:recordedBy< http://viaf.org/viaf/263074474 >< http://museum-x.org/personnel/akp >

在哪里< http://viaf.org/viaf/263074474 >是名字为“Oliver P. Pearson”的人的持久IRI标识符< http://museum-x.org/personnel/akp >是名字为“Anita K. Pearson”的人的持久IRI标识符。

2.5.3客户端遇到包含dwc:和dwciri:术语的RDF的期望(规范性)

客户端遇到一个三元组,有一个来自dwciri:命名空间作为它的谓词可以期望三元组的对象是一个IRI引用,然后可以解引用该IRI以获得关于它所代表的实体的附加信息。一个客户遇到了三个人有一个术语来自dwc:命名空间应该准备好接受文字对象,尽管有些数据提供程序可能不知道本指南已经使用了dwc:IRI引用的术语如下rdf:资源属性。应用程序开发人员应该灵活地期望属性的值dwc:名称空间。

2.6 Darwin Core ID术语和RDF(规范)

Darwin Core包含许多用于指定标识符的“ID”术语,例如,dwc: occurrenceIDdwc: identificationIDdwc: locationID等。“ID”术语提供两个函数,指定资源的类,并指示术语的值是标识符。下面的非rdf XML说明了这些函数,它是中提供的示例的一部分Darwin Core XML指南

示例21:

(non-RDF)

 http://guid.mvz.org/identifications/23459 Richard Sage 2000 urn:lsid:catalogueoflife.org:taxon:d79c11aa-29c1-102b-9a4a-00304854f820:col20120721 

此示例还可以由下面的数据库表表示,其中每个记录(行)表示一个dwc:识别实例的一个属性,其中每列表示dwc:识别实例,如列标题所示:

表3(非规范化)

dwc: identificationID dwc: identifiedBy dwc: dateIdentified dwc: taxonID
“http://guid.mvz.org/identifications/23459” “理查德圣人” “2000” “urn: lsid catalogueoflife.org:分类单元:d79c11aa - 29 - c1 - 102 b - 9 - a4a - 00304854 - f820: col20120721”

在例21和表3中,“ID”术语用于指定作为记录本身主题的资源的标识符(使用术语dwc: identificationID)并通过外键指定与主题资源相关的对象资源(使用术语dwc: taxonID).因为ID术语没有指定专门用于主题或对象,所以它们标识的资源必须在使用它们的上下文中明确。在数据库表的情况下,数据提供者和使用者之间预先存在的理解将指示表的行表示什么dwc:识别实例,因此dwc: identificationID属性将提供主题的标识符,而任何其他ID术语将引用与该特定标识实例相关的对象资源。在XML示例中,主题资源的类型是通过记录的容器元素明确的,因此消费者将知道dwc: identificationID属性引用到主题资源。在RDF中,这两个函数(指定类型和引用标识符)分别使用rdf: type声明(2.3.1节),并定义了用于表示主题资源标识符的机制(2.2节).因为这些机制在TDWG之外是众所周知的最佳实践,所以当数据表示为RDF时,应该使用它们,而不是使用Darwin Core ID术语。下面的示例显示了将示例21中的信息表示为RDF的适当方法:

示例22:

RDF / XML

< rdf:描述rdf: about =“http://guid.mvz.org/identifications/23459”>< rdf: typerdf: resource =“http://rs.tdwg.org/dwc/terms/Identification”/><使用dc:标识符>http://guid.mvz.org/identifications/23459> < /使用dc:标识符< dwc: identifiedBy >理查德圣人< / dwc: identifiedBy >< dwc: dateIdentifiedrdf:数据类型=“http://www.w3.org/2001/XMLSchema # gYear”>2000< / dwc: dateIdentified >< dwciri: toTaxonrdf: resource =“http://lsid.tdwg.org/urn: lsid catalogueoflife.org:分类单元:d79c11aa - 29 - c1 - 102 b - 9 - a4a - 00304854 - f820: col20120721”/>> < / rdf:描述

乌龟:

< http://guid.mvz.org/identifications/23459 >一个dwc:识别使用dc:标识符“http://guid.mvz.org/identifications/23459”dwc:identifiedBy“理查德圣人”dwc:dateIdentified“2000”^ ^xsd:gYeardwciri:toTaxon< http://lsid.tdwg.org/urn: lsid catalogueoflife.org:分类单元:d79c11aa - 29 - c1 - 102 b - 9 - a4a - 00304854 - f820: col20120721 >

关于例22,需要注意以下几点:

  1. 在RDF/XML中使用rdf: about属性的一个rdf:描述元素指定与主题ID术语一起使用的IRI标识符,即的值dwc: identificationID是一个HTTP IRI,因此可以与rdf: about属性。的使用dc:标识符属性还可用于将主题资源的主标识符表示为文字。在例22中,HTTP IRI被认为是Identification实例的主标识符,因此它被作为的字符串值包含使用dc:标识符以及主题资源的IRI。指2.2.1节而且2.2.2为更多的细节。
  2. 希望将主题资源关联到相关的非文字资源的数据提供程序应该使用对象属性(即,将iri识别的实例与其他iri识别的实例关联起来的属性)来自一个众所周知的词汇表或本体。Darwin Core通常不定义连接其核心类的对象属性,在这种情况下,用户必须在Darwin Core之外查找对象属性(参见达尔文核心信息辅助网页]为例)。在这个例子中,术语dwciri: toTaxon(见第2.7.4节)用来联系dwc:识别实例到分类单元实例。(请注意,这只是为了说明目的,本指南对分类单元或分类单元概念的性质或本示例中使用的资源是否实际上是一个分类单元没有立场。)
  3. 如果三元组的标识对象是非文字资源(2.4.2节), RDF要求它被IRI引用。尽管UUID“d79c11aa-29c1-102b-9a4a-00304854f820:col20120721”是分类单元的全局唯一的持久标识符,但它不是IRI。Catalog of Life以LSID的形式从UUID创建了一个IRI:
< urn: lsid catalogueoflife.org:分类单元:d79c11aa - 29 - c1 - 102 b - 9 - a4a - 00304854 - f820: col20120721 >

因此,将对象引用表示为

< dwciri: toTaxonrdf: resource =“urn: lsid catalogueoflife.org:分类单元:d79c11aa - 29 - c1 - 102 b - 9 - a4a - 00304854 - f820: col20120721”/>

将是有效的RDF。然而,最佳实践(部分2.4.2.1.1)指定当lsid是三元组的对象时,它们应该是http代理的形式。在例22中,使用TDWG LSID解析器代理LSID。

  1. 主题标识实例的类(dwc:识别)显式地使用rdf: type.对象分类实例的类型没有直接声明—客户端需要解引用IRI才能发现它。

2.6.1 RDF中使用Darwin Core ID术语的意外后果(非规范性)

上一节展示了使用Darwin Core ID术语来指示与主题资源相关联的标识符是没有必要的,因为在RDF中有一些众所周知的方法(Therdf: about属性和使用dc:标识符属性)用于公开主题的标识符。然而,如下所示,使用Darwin Core ID术语来标识对象资源(如非rdf XML示例21所示)实际上是有问题的。在其规范定义中,每个达尔文核心ID项都声明为rdfs: subPropertyOf使用dc:标识符.在RDF中,子属性声明的目的是允许具有推理能力的客户机推断包含更广泛(想必也更知名)属性的三元组。在都柏林核心的术语中," ID "一词是限定符它“精炼”了一个基本的都柏林核心术语,从一个更具体的术语推断出一个更广泛的含义的过程被称为“傻瓜”操作。如果提供程序试图将表3的数据公开为RDF,则使用dwc: taxonID项作为标识的属性,如(错误的)例23所示:

示例23:

RDF / XML(使用不正确)

< rdf:描述rdf: about =“http://guid.mvz.org/identifications/23459”>< rdf: typerdf: resource =“http://rs.tdwg.org/dwc/terms/Identification”/>< dwc: identifiedBy >理查德圣人< / dwc: identifiedBy >< dwc: dateIdentifiedrdf:数据类型=“http://www.w3.org/2001/XMLSchema # gYear”>2000< / dwc: dateIdentified >< dwc: taxonID >http://lsid.tdwg.org/urn:lsid:catalogueoflife.org:taxon:d79c11aa-29c1-102b-9a4a-00304854f820:col20120721< / dwc: taxonID >> < / rdf:描述

海龟(不正确的使用)

< http://guid.mvz.org/identifications/23459 >一个dwc:识别dwc:identifiedBy“理查德圣人”dwc:dateIdentified“2000”^ ^xsd:gYeardwc:taxonID“http://lsid.tdwg.org/urn: lsid catalogueoflife.org:分类单元:d79c11aa - 29 - c1 - 102 b - 9 - a4a - 00304854 - f820: col20120721”

如果不熟悉Darwin Core的客户端执行“简化”操作(即退回到更广泛的含义),就会产生不希望的效果dwc: taxonID任期使用dc:标识符).客户会推断出三种情况:

表4

主题 谓词 对象
http://guid.mvz.org/identifications/23459 使用dc:标识符 “http://lsid.tdwg.org/urn: lsid catalogueoflife.org:分类单元:d79c11aa - 29 - c1 - 102 b - 9 - a4a - 00304854 - f820: col20120721”

的价值在哪里dwc: taxonIDTerm是主题资源的标识符,而不是数据提供者所希望的对象资源的标识符。这就是为什么数据提供者通常需要在Darwin Core之外寻找可用于将一个类的实例与另一个类的实例关联起来的对象属性,而不是使用Darwin Core ID术语。

2.7达尔文核心便利术语(非规范性)

在几种情况下,基于文本的Darwin Core数据的提供者使用一组分层属性/值对来明确地指定资源。例如,一个在N 36.4024°,W 87.02219°收集的资源的数据库记录可能包含以下数据:

表5

dwc: decimalLatitude dwc: decimalLongitude dwc: geodeticDatum dwc:大陆 dwc:国家 dwc: stateProvince dwc:县
“36.4024” “-87.02219” “EPSG: 4326” “北美” “美国” “田纳西” “罗伯逊”

该数据明确指定了最低级别的政治分区(罗伯逊县),包括了层次结构中的更高级别的政治分区,从而将其与其他以字符串“罗伯逊”标识的二级行政分区(例如,美国德克萨斯州的罗伯逊县或美国肯塔基州的罗伯逊县)区分了出来。用来形成文字值层次结构的核心术语称为便利术语。

2.7.1便利条款的目的是什么?(非规范化)

当用RDF表示关于Robertson县收集的资源的数据时,确实没有必要在每个记录中表明北美是美国的一个父特征,美国是田纳西州的一个父特征,而田纳西州是Robertson县的一个父特征。只需要将记录与罗伯逊县的IRI联系起来,例如< http://sws.geonames.org/4653638/ >语义客户机可以通过遍历的方式发现父特性gn: parentFeature包含在层次结构中的特性的属性。一旦客户端发现了它感兴趣的层次结构的更高级别部分,就不需要额外检索关于层次结构的数据。

一般来说,数据提供者不应该需要重新创建已经由集中服务表示的分层RDF关系。因此,本指南没有描述用RDF表示这种关系的最佳实践。然而,有几个原因可以解释为什么数据提供者可以方便地从现有的基于文本的数据中公开文字值:

  • 提供者可能无法或不愿意发现并链接到层次结构的最低级别的IRI,但希望通过应用程序或聚合器的字符串匹配促进未来发现此类IRI。
  • 提供者可能希望方便简单的基于字符串的查询(例如,SPARQL)。
  • 提供者可能希望使消费应用程序更容易创建对人友好的数据表示,其中表示字符串层次结构是有意义的。

2.7.2文字便利术语与单个对象属性引用(规范)的对比

中有几组方便术语dwc:命名空间,可用于为上述目的提供文字值(3.6节).对于这些组中的每一组,不期望提供者将链接到层次结构中的每一层的IRI引用。因此,dwciri:没有为这些便利术语定义类似的词dwc:名称空间。相反,对于每一类便利术语,都有一个单一的dwciri:名称空间术语(在dwc:名称空间;3.7节),它可用于链接到层次结构中可用的最低级别,同时了解对象资源的RDF将为层次结构的更高级别提供到其他iri的链接。这样的dwciri:如果较低级别的身份不确定,或者较低级别不存在,术语可以指层次结构中的任何级别。

表6

便利项类别 对象属性 对象资源类别 Rdf:示例资源的类型
收藏品的拥有权(第2.7.3条) dwciri: inCollection 集合 未指定
分类实体的描述(第2.7.4节) dwciri: toTaxon 分类单元的概念;分类单元的名称使用 dwc:分类单元
地理分区名称(第2.7.5节) dwciri: inDescribedPlace 地理位置 gn:功能
年代地层(地质时标)描述(第2.7.6节) dwciri: earliestGeochronologicalEra dwciri: latestGeochronologicalEra 学时期 gsml: GeochronologicEra
岩石地层描述符(第2.7.7节) dwciri: fromLithostratigraphicUnit 岩石地层单位 未指定

2.7.3收集项的所有权(规范性)

历史上,一系列的价值dwc: institutionCodedwc: collectionCode,dwc: catalogNumber(一个“Darwin Core三元组”)已被用于识别一个收藏项目,并指示拥有该机构的机构和该机构内的收藏,如表7所示。

表7(非规范化)

dwc: basisOfRecord dwc: institutionCode dwc: collectionCode dwc: catalogNumber dwc: collectionID
“PreservedSpecimen” “MVZ” “Mamm” “115956” “urn: lsid biocol.org:上校:34904”

在RDF中,集合项的唯一标识是通过IRI完成的,IRI充当该项的全局唯一标识符。Darwin Core三元组属性仍然可以作为文字值提供,但是集合项的所有权/控制权应该使用表示dwciri: inCollection使用HTTP IRI作为IRI引用对象。对于物理样本,推荐的最佳实践是使用集合注册中心中的集合IRI,例如来自的http代理LSID全球生物库注册.例24说明了表7中的数据。

例24:

RDF / XML

< rdf:描述rdf: about =“http://arctos.database.museum/guid/MVZ: Mamm: 115956”>< rdf: typerdf: resource =“http://rs.tdwg.org/dwc/terms/PreservedSpecimen”/>< dwc: institutionCode >MVZ< / dwc: institutionCode >< dwc: collectionCode >Mamm< / dwc: collectionCode >< dwc: catalogNumber >115956< / dwc: catalogNumber >< dwciri: inCollectionrdf: resource =“http://biocol.org/urn: lsid biocol.org:上校:34904”/>> < / rdf:描述

乌龟

< http://arctos.database.museum/guid/MVZ: Mamm: 115956 >一个dwc:PreservedSpecimendwc:collectionCode“Mamm”dwc:institutionCode“MVZ”dwc:catalogNumber“115956”dwciri:inCollection< http://biocol.org/urn: lsid biocol.org:上校:34904 >

2.7.4分类实体描述(规范)

共识体现在TDWG分类概念转移模式(TCS)标准标识实例指的是分类单元概念实例。因此,最好的做法是将RDF中的分类实体描述为TCS意义上的分类单元概念。但是,因为TCS标准是XML模式,所以不能直接翻译为RDF。指定如何将分类单元概念呈现为RDF被认为超出了本文档的范围。尽管如此,达尔文核心确实定义了许多便利术语dwc:分类单元类的属性dwc:识别实例(3.5节).

有人可能会说这些便利项更适合作为a的属性dwc:分类单元实例。但是,需要关联的对象属性dwc:分类单元命名实体、引用、父分类单元和子分类单元的实例并不存在,而且还没有使用RDF建立分类单元概念、质子、分类单元名称使用等分类实体之间的确切关系。函数的生成dwc:分类单元使用RDF描述实例目前是不可能的。因此,本文确立了分类实体的便利术语应该是属性的约定dwc:识别.使用RDF描述分类实体的任务必须在Darwin Core之外进行。本指南建立对象属性dwciri: toTaxon用于将达尔文核心识别实例与别处定义的分类实体关联。

考虑下面的例子,Takuma Yun确定了蜘蛛的种类Hersilia yaeyamaensis使用Tanikawa(1999)的信息。有关鉴定的数据列在数据库中,如表8所示。

表8(非规范化)

dwc: identificationID dwc: identifiedBy dwc:订单 dwc:家庭 dwc:属 dwc: specificEpithet dwc: nameAccordingToID
“75 c9ea16 - 72 - b1 - 44 - c9 - ad40 3 - c3a41323a09” “佐藤Yun” “蜘蛛类” “Hersiliidae” “Hersilia” “yaeyamaensis” “75 c9ea16 - 72 - b1 - 44 - c9 - ad40 3 - c3d41323ab9”

在此示例中,最佳实践是将标识实例链接到的分类单元实例Hersilia yaeyamaensisTanikawa 1999使用对象属性dwciri: toTaxon如例22所示。但是,数据提供者可能不感兴趣,或者无法创建或发现标识实例可以链接到的分类单元实例。提供者可能只是希望更容易发现标识实例,而不关心可能为列出的名称组件定义的概念断言的分类法关系。在这种情况下,提供者可以使用以下RDF:

例25:

RDF / XML

< rdf:描述rdf: about =“http://museum.or.jp/9ac9bd26 - 8 b41 - 458 a - aa35 - 503 a4527d009”>< rdf: typerdf: resource =“http://rs.tdwg.org/dwc/terms/Identification”/>< dwc: identifiedBy >佐藤云< / dwc: identifiedBy >< dwc:订单>蜘蛛类> < / dwc:秩序< dwc:家庭>Hersiliidae< / dwc:家庭>< dwc:属>Hersilia< / dwc:属>< dwc: specificEpithet >yaeyamaensis< / dwc: specificEpithet >< dwc: nameAccordingTo >Tanikawa 1999< / dwc: nameAccordingTo >> < / rdf:描述

乌龟:

< http://museum.or.jp/9ac9bd26 - 8 b41 - 458 a - aa35 - 503 a4527d009 >一个dwc:识别dwc:identifiedBy“佐藤Yun”dwc:订单“蜘蛛类”dwc:家庭“Hersiliidae”dwc:“Hersilia”dwc:specificEpithet“yaeyamaensis”dwc:nameAccordingTo“Tanikawa 1999”

在本例中,提供了三元组

< http:/ / museum.or.jp / 9 ac9bd26 - 8 b41 - 458 a - aa35 - 503 a4527d009>dwc:秩序”蜘蛛类”

不应该被认为Takuma Yun断言他所识别的蜘蛛属于Araneae目,也不应该被认为RDF暗示Takuma Yun断言Aranaeae是该属的一个父分类单元的名称Hersilia.这些类型的断言需要使用更复杂的RDF和Darwin Core之外表达能力更强的词汇表来实现。RDF只是让查找蜘蛛标识的用户更容易通过查找具有的标识来搜索它们dwc:订单“蜘蛛类”,起重集团:属“Hersilia”和一个特定的称谓“yaeyamaensis”。如果可以确定(也许以后会确定)便利术语所描述的分类单元对应于特定的iri识别实例,则可以使用对象属性将识别实例链接到该实例,例如:

< http:/ / muse.or.jp / 9 ac9bd26 - 8 b41 - 458 a - aa35 - 503 a4527d009>dwciri: toTaxon< http:/ / zoobank.org/75c9ea16 - 72 - b1 - 44 - c9 - ad40 3 - c3d41323ab9>

2.7.5地理分区名称(规范性)

表5中的数据可以表示为例26所示。在这个例子中,术语dwciri: inDescribedPlace用作对象属性链接使用dc:位置实例向IRI申请适用于当地的最低已知地理分区。dwc:位置也可以用来提供地点的特定描述的字符串文字描述。

26个例子:

RDF / XML

< rdf:描述rdf: about =“http://bioimages.vanderbilt.edu/baskauf/00001 loc”>< rdf: typerdf: resource =“http://purl.org/dc/terms/Location”/>< dwc: decimalLatituderdf:数据类型=“http://www.w3.org/2001/XMLSchema小数”>36.4024< / dwc: decimalLatitude >< dwc: decimalLongituderdf:数据类型=“http://www.w3.org/2001/XMLSchema小数”>-87.02219< / dwc: decimalLongitude >< dwc: geodeticDatum >EPSG: 4326< / dwc: geodeticDatum >< dwc:大陆>北美> < / dwc:大陆> < dwc:国家美国> < / dwc:国家< dwc: stateProvince >田纳西州< / dwc: stateProvince >< dwc:县>罗伯逊> < / dwc:县< dwciri: inDescribedPlacerdf: resource =“http://sws.geonames.org/4653638/”/>> < / rdf:描述

乌龟

< http://bioimages.vanderbilt.edu/baskauf/00001 loc >一个使用dc:位置dwc:decimalLatitude“36.4024”^ ^xsd:小数dwc:decimalLongitude“-87.02219”^ ^xsd:小数dwc:geodeticDatum“EPSG: 4326”dwc:大陆“北美”dwc:国家“美国”dwc:stateProvince“田纳西”dwc:“罗伯逊”dwciri:inDescribedPlace< http://sws.geonames.org/4653638/ >

因为泛型RDF对重复属性没有限制,所以a使用dc:位置实例可以有多个dwciri: inDescribedPlace属性,如果该位置包括在几个描述的地理分区内。例如,一个特定的位置可以包含在< http://sws.geonames.org/4626068/ >(大烟山国家公园横跨两个州)和< http://sws.geonames.org/4656568/ >(美国田纳西州塞维尔县,这是最低级别的政治分区)。

2.7.6年代地层(地质时标)描述符(规范)

下面的例子取自http://dx.doi.org/10.1098/rsbl.2011.0228,这涉及化石的地质背景,作为物种描述的正模。在这个例子中(表9),只有一个纪元(中侏罗世)的值,因此每个的值最早/最新…地层时标条件对是相同的。

表9(非规范化)

dwc:形成 dwc: earliestEonOrLowestEonothem dwc: latestEonOrHighestEonothem dwc: earliestEraOrLowestErathem dwc: latestEraOrHighestErathem dwc: earliestPeriodOrLowestSystem dwc: latestPeriodOrHighestSystem dwc: earliestEpochOrLowestSeries dwc: latestEpochOrHighestSeries
“Jiu-longshan” “显生宙” “中生代” “侏罗纪” “中间”

示例27展示了如何使用达尔文地核地层时间尺度术语作为方便术语将其呈现为RDF。

例27:

RDF / XML

< rdf:描述rdf: about =“http://paleo.cnu.edu.cn/ara/nn2010008上下文”>< rdf: typerdf: resource =“http://rs.tdwg.org/dwc/terms/GeologicalContext”/>< dwc:形成>Jiu-longshan> < / dwc:形成< dwc: earliestEonOrLowestEonothem >显生宙< / dwc: earliestEonOrLowestEonothem >< dwc: latestEonOrHighestEonothem >显生宙< / dwc: latestEonOrHighestEonothem >< dwc: earliestEraOrLowestErathem >中生代< / dwc: earliestEraOrLowestErathem >< dwc: latestEraOrHighestErathem >中生代< / dwc: latestEraOrHighestErathem >< dwc: earliestPeriodOrLowestSystem >侏罗纪< / dwc: earliestPeriodOrLowestSystem >< dwc: latestPeriodOrHighestSystem >侏罗纪< / dwc: latestPeriodOrHighestSystem >< dwc: earliestEpochOrLowestSeries >中间< / dwc: earliestEpochOrLowestSeries >< dwc: latestEpochOrHighestSeries >中间< / dwc: latestEpochOrHighestSeries >< dwciri: earliestGeochronologicalErardf: resource =“http://resource.geosciml.org/classifier/ics/ischart/MiddleJurassic”/>< dwciri: latestGeochronologicalErardf: resource =“http://resource.geosciml.org/classifier/ics/ischart/MiddleJurassic”/>> < / rdf:描述

乌龟

< http://paleo.cnu.edu.cn/ara/nn2010008 >背景一个dwc:GeologicalContextdwc:形成“Jiu-longshan”dwc:earliestEonOrLowestEonothem“显生宙”dwc:latestEonOrHighestEonothem“显生宙”dwc:earliestEraOrLowestErathem“中生代”dwc:latestEraOrHighestErathem“中生代”dwc:earliestPeriodOrLowestSystem“侏罗纪”dwc:latestPeriodOrHighestSystem“侏罗纪”dwc:earliestEpochOrLowestSeries“中间”dwc:latestEpochOrHighestSeries“中间”dwciri:earliestGeochronologicalEra< http://resource.geosciml.org/classifier/ics/ischart/MiddleJurassic >dwciri:latestGeochronologicalEra< http://resource.geosciml.org/classifier/ics/ischart/MiddleJurassic >

在本例中,对象属性dwciri: earliestGeochronologicalEra而且dwciri: latestGeochronologicalEra类的实例的IRI链接gsml: GeochronologicEra类,该类使用SKOS将中侏罗世与地代史层次中的更高层次联系起来。

2.7.7岩石地层描述符(规范)

由于岩石地层单元是分级的,与其他分级便利术语相遵循的模式适用于分类在dwc: GeologicalContext类(dwc:组dwc:形成dwc:成员,dwc:床).对象属性dwciri: fromLithostratigraphicUnit可用于连接一个岩石地层单元在最低适当水平的IRI。

2.8达尔文核心联想术语(非规范性)

Darwin Core包含许多本地名称以“associated”开头的术语(dwc: associatedMediadwc: associatedOccurrences等),在本指南中称为“关联条款”。因为这些术语的设计目的是将主题资源链接到平面的、基于文本的数据系统中的一个或多个相关资源,所以它们需要特殊处理以将其值表示为iri引用对象。

2.8.1关联条款的目的是什么?(非规范化)

由Darwin Core关联术语属性/值对编码的信息可以被分解为三个部分:

  • 指向相关资源的链接
  • 相关资源类型的指定
  • (对某些术语来说)对关系的性质包括其方向的描述

相关资源由文字值中的某种标识符指定。相关资源的类型由本地名称的第二部分表示(例如,“Media”、“occurs”等)。部分术语的定义(dwc: associatedTaxadwc: associatedOccurrences,dwc: associatedOrganisms)还指定与主题资源关联的性质也应包含在文字值中(“sibling of”、“predator of”等)。

2.8.2将Darwin Core关联术语表示为带文字值的RDF(规范性)

数据库可能包含表10所示的信息。

表10(非规范化)

dwc: organismID dwc: associatedOrganisms dwc: associatedMedia
“http://bioimages.vanderbilt.edu/ind-durandp/dd343” “AX3467兄弟” “http://bioimages.vanderbilt.edu/durandp/dd343 http://bioimages.vanderbilt.edu/durandp/dd344 |”

方法可以将这些数据序列化为RDFdwc:名称空间文字值术语dwc: associatedOrganisms而且dwc: associatedMedia如例28所示。

例28日:

RDF / XML

< rdf:描述rdf: about =“http://bioimages.vanderbilt.edu/ind-durandp/dd343”>< rdf: typerdf: resource =“http://rs.tdwg.org/dwc/terms/Organism”/>< dwc: associatedOrganisms >兄弟姐妹的AX3467< / dwc: associatedOrganisms >< dwc: associatedMedia >http://bioimages.vanderbilt.edu/durandp/dd343 | http://bioimages.vanderbilt.edu/durandp/dd344< / dwc: associatedMedia >> < / rdf:描述

乌龟:

< http://bioimages.vanderbilt.edu/ind-durandp/dd343 >一个dwc:生物dwc:associatedOrganisms“AX3467兄弟”dwc:associatedMedia“http://bioimages.vanderbilt.edu/durandp/dd343 http://bioimages.vanderbilt.edu/durandp/dd344 |”

因为关联术语的值是字面量,消费客户机需要执行额外的处理,以确定字面量中引用的关联资源的标识。在值为的情况下dwc: associatedOrgansims,客户端必须确定子串“AX3467”是生物体的标识符,并确定由子串“sibling of”表示的关系的性质。在值为的情况下dwc: associatedMedia,客户端将需要解析值字符串中包含的标识符,然后确定这些子字符串是IRIs。

通过RDF表示Darwin Core关联属性的文字值(如例28所示)的优点是,提供程序可以轻松地公开现有的数据,而且工作量很小。缺点是对消费客户端会有很大的处理负担。如果没有来自其他来源的附加信息,有些文字值可能无法解释。例如,被“AX3467”识别的生物体如何从全局上与其他可能被指定为“AX3467”标识符的生物体区分开来?

2.8.3将Darwin Core关联术语表示为带有URI引用的RDF(规范的)

因为Darwin Core关联术语属性/值对实际上编码了两个或多个离散的“事实”,所以用多个三元组来表示属性/值对中包含的信息可能更好。

著名的都柏林核心术语使用dc:关系< http://purl.org/dc/terms/relation >)可连结相关资源。使用dc:关系没有指定关系的确切性质,尽管它有许多声明的子属性,可以更精确地指定关系的类型和方向(例如:使用dc: hasPart使用dc: isPartOf使用dc: hasFormat使用dc: isFormatOf使用dc:引用使用dc: isVersionOf等)。所以使用dc:关系是一个通用术语,可用来表示资源与其他一些资源具有未指定的关联。

这个词rdf: type2.3.1节)是在RDF中指示资源类型的标准属性。因此,应该使用它来声明Darwin Core关联术语属性/值对的对象资源的类型。

如果为此目的存在适当的术语,则可以更精确地描述主客体资源之间关联的性质和方向。例如,在许多情况下,通过链接的主题和对象资源之间的关系dwc: associatedMedia是描述。这就是众所周知的术语foaf: depiction可以用来链接两个资源的代替,还是附加使用dc:关系

示例29展示了如何使用uri引用属性而不是Darwin Core关联属性将表10中的数据表示为RDF。

29个例子:

RDF / XML

< rdf:描述rdf: about =“http://bioimages.vanderbilt.edu/ind-durandp/dd343”>< rdf: typerdf: resource =“http://rs.tdwg.org/dwc/terms/Organism”/><使用dc:关系rdf: resource =“http://museum.org/individuals/ax3467”/><使用dc:关系rdf: resource =“http://bioimages.vanderbilt.edu/durandp/dd343”/>< foaf:描述rdf: resource =“http://bioimages.vanderbilt.edu/durandp/dd343”/><使用dc:关系rdf: resource =“http://bioimages.vanderbilt.edu/durandp/dd344”/>< foaf:描述rdf: resource =“http://bioimages.vanderbilt.edu/durandp/dd344”/>> < / rdf:描述< rdf:描述rdf: about =“http://museum.org/individuals/ax3467”><使用dc:标识符>AX3467> < /使用dc:标识符< rdf: typerdf: resource =“http://rs.tdwg.org/dwc/terms/Organism”/>> < / rdf:描述< rdf:描述rdf: about =“http://bioimages.vanderbilt.edu/durandp/dd343”>< rdf: typerdf: resource =“http://purl.org/dc/dcmitype/StillImage”/>> < / rdf:描述< rdf:描述rdf: about =“http://bioimages.vanderbilt.edu/durandp/dd344”>< rdf: typerdf: resource =“http://purl.org/dc/dcmitype/StillImage”/>> < / rdf:描述

乌龟:

< http://bioimages.vanderbilt.edu/ind-durandp/dd343 >一个dwc:生物使用dc:关系< http://museum.org/individuals/ax3467 >使用dc:关系< http://bioimages.vanderbilt.edu/durandp/dd343 >foaf:描述< http://bioimages.vanderbilt.edu/durandp/dd343 >使用dc:关系< http://bioimages.vanderbilt.edu/durandp/dd344 >foaf:描述< http://bioimages.vanderbilt.edu/durandp/dd345 >< http://museum.org/individuals/ax3467 >使用dc:标识符“AX3467”一个dwc:生物< http://bioimages.vanderbilt.edu/durandp/dd343 >一个dcmitype:StillImage< http://bioimages.vanderbilt.edu/durandp/dd344 >一个dcmitype:StillImage

注:

  1. 因为没有一个众所周知的术语来表示“兄弟姐妹”的关系,两个相关生物之间关系的本质没有在三元组中表示出来。
  2. 在这个例子中,两个相关的媒体项目都是对主体生物的描述,所以foaf: depiction用来表示…但是,很可能许多相关的媒体项不会描述主题资源。例如,标本标签不描绘与之相关的标本,栖息地的静态图像也不描绘与之相关的生物体。因此,需要更有表现力的术语来更精确地描述这些类型的关系。但是,创建这样的术语超出了本指南的范围。

2.8.4关联资源查询(非规范)

如果战略概述在部分2.8.3使用了与主题资源关联的资源,就可以使用SPARQL查询类似于例30。在这个示例中,< iri1 >是主题资源的IRI, ' dcmitype:StillImage '是将被发现的关联媒体的类型。

30例子:

SPARQL

前缀使用dc:< http://purl.org/dc/terms/ >前缀dcmitype:< http://purl.org/dc/dcmitype/ >选择资源?在哪里< iri1 >使用dc:关系资源?资源?一个dcmitype:StillImage

2.9 MeasurementOrFact实例(规范性)

Darwin Core提供了一种机制,用于表示与使用Darwin Core描述的资源相关的度量和事实信息。的条款dwc:命名空间中组织的dwc: MeasurementOrFact类被设计成在“平面”文件中使用字符串值来表达此信息。还可以使用文字值的组合将信息表示为RDFdwc:命名空间术语和IRI值dwciri:条款。这些信息很可能也可以映射到更有表现力的词汇上。然而,这种翻译超出了本指南的范围。

度量属性可以分组为dwc: MeasurementOrFact实例,如例31所示。为了使该实例具有意义,它必须链接到作为被测量实体的其他一些资源。在例31中,当一个有机体作为保存的标本收集并记录其发生时,进行了测量。测量的是记录在案的生物体的一部分。鉴于有机体本身被保存了下来,这种测量方法也适用于标本的相应部分。Darwin Core没有提供精确描述如何dwc: MeasurementOrFact实例与dwc:发生例如,dwc:生物谁的事件被记录下来了,还是dwc: PreservedSpecimen这是收集。在这个例子中,使用dc:关系被用来连接dwc: MeasurementOrFact实例的dwc:发生实例,该实例是数据库记录的主题,作为示例31中序列化为RDF的数据的来源。提供者可以进行链接dwc: MeasurementOrFact在Darwin Core之外使用更具表达性的对象属性的实例。看到达尔文核心信息辅助网页为更多的信息。

例31

RDF / XML

< dwc:发生rdf: about =“http://mczbase.mcz.harvard.edu/guid/MCZ: Mamm: 67231”><使用dc:关系>< dwc: MeasurementOrFact >< dwc: measurementType >尾巴的长度< / dwc: measurementType >< dwciri: measurementTyperdf: resource =“http://purl.obolibrary.org/obo/VT_0002758”/>< dwc: measurementValuerdf:数据类型=“http://www.w3.org/2001/XMLSchema int”>25< / dwc: measurementValue >< dwc: measurementUnit >毫米< / dwc: measurementUnit >< dwciri: measurementUnitrdf: resource =“http://mimi.case.edu/ontologies/2009/1/UnitsOntology毫米”/>< dwc: measurementAccuracyrdf:数据类型=“http://www.w3.org/2001/XMLSchema小数”>0.5< / dwc: measurementAccuracy >< dwc: measurementDeterminedDaterdf:数据类型=“http://www.w3.org/2001/XMLSchema日期”>2009-08-22< / dwc: measurementDeterminedDate >< dwc: measurementDeterminedBy >瑞安B斯蒂芬斯< / dwc: measurementDeterminedBy >< dwciri: measurementDeterminedByrdf: resource =“http://scholar.google.com/citations?user=RAsUdjoAAAAJ”/>< dwc: measurementMethod >未指明的< / dwc: measurementMethod >< dwciri: measurementMethodrdf: resource =“http://purl.obolibrary.org/obo/MMO_0000160”/>< dwc: measurementRemarksxml: lang =“en”>有效数字的精度。< / dwc: measurementRemarks >< / dwc: MeasurementOrFact >> < /使用dc:关系> < / dwc:出现

乌龟

< http://mczbase.mcz.harvard.edu/guid/MCZ: Mamm: 67231 >一个dwc:发生使用dc:关系一个dwc:MeasurementOrFactdwc:measurementType“尾部长度”dwciri:measurementType< http://purl.obolibrary.org/obo/VT_0002758 >dwc:measurementValue“25”^ ^xsd:intdwc:measurementUnit“毫米”dwciri:measurementUnit毫米< http://mimi.case.edu/ontologies/2009/1/UnitsOntology >dwc:measurementAccuracy“0.5”^ ^xsd:小数dwc:measurementDeterminedDate“2009-08-22”^ ^xsd:日期dwc:measurementDeterminedBy“瑞恩B史蒂芬斯”dwciri:measurementDeterminedBy< http://scholar.google.com/citations?user=RAsUdjoAAAAJ >dwc:measurementMethod“不明”dwciri:measurementMethod< http://purl.obolibrary.org/obo/MMO_0000160 >dwc:measurementRemarks“有效数字的精度。”@en]

3术语参考(规范性)

本节根据术语在RDF中的使用,组织来自Darwin Core和其他关键词汇表的术语。如果一个术语的使用有额外的限制或影响(例如,域和范围断言),那么将加以注意。在适当的时候给出了推荐的格式和值。

3.1用RDF(规范)表达基本属性所需的非达尔文核心术语

术语 笔记
rdf: type 用于指示资源是其实例的类。最好的做法是使用rdf:type为资源类型,而使用使用dc:类型而且dwc: basisOfRecord是可选的。看到2.3.1.5节与生物多样性资源一起使用的推荐类。
使用dc:标识符 用于将字符串文字标识符与主题资源关联。这可以包括IRIs的字符串表示形式,如果它们被认为是资源的标识符。
使用dc:关系 用于链接具有未指定关联的主题和对象资源。

3.2导入的Dublin Core术语只适用于文字对象(规范性)

术语 范围
使用dc:修改 - - - - - - rdfs:文字1
使用dc: bibliographicCitation 使用dc: BibliographicResource rdfs:文字

3.3导入的具有非文字对象的Dublin Core术语和具有文字对象的对应术语(规范性)

在RDF中与非文字对象一起使用的术语2 范围 推荐值3. 在RDF中与文字对象一起使用的术语
使用dc:语言 使用dc: LinguisticSystem MARC ISO 639-2语言IRI dc:语言
使用dc:许可证4 使用dc: LicenseDocument 知识共享许可协议 xmpRights: UsageTerms5
使用dc:类型 rdfs:类 DCMI类型的词汇 dc:类型
使用dc:权力 使用dc:代理 IRI用于拥有或管理权限的代理。 xmpRights:老板6
使用dc: accessRights 使用dc: RightsStatement 可以创建一个自定义RDF权限语句,描述谁可以访问该资源或指示其安全状态。 这个术语没有字面对象的类似物存在。字符串值可以表示为空节点的属性。7
使用dc:引用 - - - - - - IRI用于与主题资源相关的发布(最好是http代理的DOI)。 使用dwc: identificationReferences供分类学鉴定时参考之用dwc: associatedReferences有关事件的参考资料。

3.4 Darwin Core定义的仅用于文字值(规范性)的术语

达尔文的核心词 关于用RDF表示的说明
dwc: eventDate
dwc: georeferencedDate
dwc: dateIdentified
dwc: relationshipEstablishedDate
dwc: measurementDeterminedDate
这些日期期限是有范围的rdfs:文字8.术语定义中指定的最佳实践建议它们应该根据ISO 8601:2004 (E).没有明确的定义XML Schema数据类型与ISO 8601:2004(E)完全对应,因此整个可能的值集不能使用rdf:数据类型属性。的XML Schema dateTime数据类型xsd: dateTime),该标准是ISO 8601:2004(E)标准的一个有效子集,可用作rdf:数据类型属性。然而,xsd: dateTime要求完整的年、月、日、时、秒的序列(例如,002-10-10T12:00:00),不允许只列出这个层次结构的一部分(例如,只列出年),这是ISO 8601:2004(E)中允许的。
dwc: eventTime 建议采用ISO 8601:2004 (E)被使用。和日期条款一样,没有XML Schema数据类型它包含了ISO 8601:2004(E)中允许的所有可能值,所以没有通用值rdf:数据类型属性,该属性将应用于所有可能的实例。的XML Schema dateTime数据类型xsd:时间),它实际上是ISO 8601:2004(E)的一个子集rdf:数据类型属性,尽管它被限制为包括小时、分钟和秒的值(例如,13:07:56-05:00)。
dwc: individualCount
dwc: decimalLatitude
dwc: decimalLongitude
dwc: coordinatePrecision
dwc: pointRadiusSpatialFit
dwc: coordinateUncertaintyInMeters
dwc: minimumElevationInMeters
dwc: maximumElevationInMeters
dwc: minimumDepthInMeters
dwc: maximumDepthInMeters
dwc: minimumDistanceAboveSurfaceInMeters
dwc: maximumDistanceAboveSurfaceInMeters
dwc: startDayOfYear
dwc: endDayOfYear
dwc:年
dwc:月
dwc:天
dwc: footprintSpatialFit
dwc: measurementValue
dwc: measurementAccuracy
这些术语应该具有数值形式的文字值。因此,一个rdf:数据类型属性描述该数字的形式。
dwc: occurrenceRemarks
dwc: eventRemarks
dwc: locationRemarks
dwc: georeferenceRemarks
dwc: identificationRemarks
dwc: taxonRemarks
dwc: organismRemarks
dwc: relationshipRemarks
dwc: measurementRemarks
因为这些是注释,所以它们应该具有带有xml: lang属性。
dwc: catalogNumber
dwc: samplingEffort
dwc: organismName
dwc: verbatimEventDate
dwc: verbatimLocality
dwc: verbatimElevation
dwc: verbatimCoordinates
dwc: verbatimLatitude
dwc: verbatimLongitude
dwc: verbatimDepth
dwc: verbatumTaxonRank
根据术语定义,这些术语应该具有未类型化的文字值
dwc: otherCatalogNumbers 由于人们使用的标识符的种类和标识符之间可能存在的各种关系,所以不存在简单的映射。对于表示为字符串值的非iri标识符,字符串可以作为的文字值提供dwc: otherCatalogNumbers.这是否优于提供多个dwc: catalogNumber属性可能取决于社区实践。猫头鹰:不同可用于将其他IRI标识符与主题IRI相关联(如果合适的话)。
dwc: basisOfRecord 仅与由Darwin Core类IRIs的本地名称组件组成的字面值字符串一起使用。使用rdf: type以引用描述资源类型的IRIs。
dwc: dynamicProperties 期望以文字形式包含JSON。实践团体可能会选择使用其他词汇表或开发自己的词汇表,以RDF的形式直接表示这类内容。

3.5 Darwin Core便利术语,预期仅与文字值一起使用(规范)

看到2.7节有关“方便”术语的更多信息。

达尔文的核心词 笔记
dwc: collectionCode
dwc: institutionCode
dwc: ownerInstitutionCode
主题资源可以是集合中的任何资源。作为一种替代方法,可以使用object属性dwciri: inCollection将主题资源链接到包含拥有或控制该资源的机构的集合的IRI。
dwc:王国
dwc:门
dwc:类
dwc:订单
dwc:家庭
dwc:属
dwc:亚属
dwc: specificEpithet
dwc: infraspecificEpithet
dwc: higherClassification
dwc: vernacularName
dwc: nameAccordingTo
dwc: scientificName
dwc: taxonRank
dwc: scientificNameAuthorship
dwc: nomenclaturalStatus
dwc: namePublishedIn
dwc: namePublishedInYear
dwc: nomenclaturalCode
dwc: originalNameUsage
dwc: taxonomicStatus
dwc: parentNameUsage
dwc: acceptedNameUsage
主题资源应该是dwc:识别实例。看到第2.7.4节关于为什么不建议使用这些属性的讨论dwc:分类单元实例。作为一种替代方法,可以使用object属性dwciri: toTaxon连接主题dwc:识别实例到分类法实体,例如分类单元、分类单元概念或分类单元名称使用。这些分类实体很可能具有一个复杂的结构,该结构在名称实体、名称字符串、名称对概念的应用之间进行区分,它表示实体之间的父/子关系和集合关系,并跟踪关于名称、引用和概念的来源信息。基于文本的达尔文核心的扁平性不能表示如此复杂的结构,这超出了本指南的描述范围。
dwc: higherGeography
dwc:大陆
dwc:严禁
dwc: islandGroup
dwc:岛
dwc: countryCode
dwc:国家
dwc: stateProvince
dwc:县
dwc:直辖市
dwc:位置
主题资源应该是使用dc:位置实例。作为一种替代方法,可以使用object属性dwciri: inDescribedPlace将主题资源链接到作为层次结构一部分描述的标准化位置。看到2.7.5节获取详细信息。提供程序很可能希望为提供文本值dwc:位置即使dwciri: inDescribedPlace用于替换此类别中的其他层次便利术语。这是因为在这个最具体的层次上(例如,“埃森以北15公里”)不太可能用一个标准的iri识别的地点实例来表示。没有dwciri:模拟的dwc:位置因为如果一个iri识别的地方可以用来表示本地,这个术语dwciri: inDescribedPlace会被用来链接到它。
dwc: earliestEonOrLowestEonothem
dwc: latestEonOrHighestEonothem
dwc: earliestEraOrLowestErathem
dwc: latestEraOrHighestErathem
dwc: earliestPeriodOrLowestSystem
dwc: latestPeriodOrHighestSystem
dwc: earliestEpochOrLowestSeries
dwc: latestEpochOrHighestSeries
dwc: earliestAgeOrLowestStage
dwc: latestAgeOrHighestStage
主题资源应该是dwc: GeologicalContext实例。作为一种替代方法,可以使用对象属性dwciri: earliestGeochronologicalEra而且dwciri: latestGeochronologicalEra中描述的3.6节.看到部分2.7.6获取详细信息。
dwc: lithostratigraphicTerms
dwc:组
dwc:形成
dwc:成员
dwc:床
主题资源应该是dwc: GeologicalContext实例。作为一种替代方法,可以使用object属性dwciri: fromLithostratigraphicUnit将主题资源与岩石地层层次中最低的适当单位联系起来。

3.6dwciri:术语的本地名称与dwc:Darwin Core命名空间(规范的)

达尔文的核心词 笔记
dwciri: inCollection 用于将作为集合一部分的任何主题资源链接到包含该资源的集合。推荐的最佳实践是使用虹膜全球生物库注册.控件中的受控值的来源列表达尔文核心信息辅助网页.看到2.7.3节使用的细节。
dwciri: toTaxon 用于连接dwc:识别受分类实体(如分类单元、分类单元概念或分类单元名称使用)约束的实例。看到第2.7.4节使用的细节。
dwciri: inDescribedPlace 用于连接使用dc:位置实例服从最低级别的标准化层次结构描述资源。预计这些资源将由制造IRI的组织与层次结构中的更高级别联系起来。建议的最佳实践是使用GeoNames地理数据库.控件中的受控值的来源列表达尔文核心信息辅助网页.看到2.7.5节使用的细节。
dwciri: earliestGeochronologicalEra
dwciri: latestGeochronologicalEra
用于连接dwc: GeologicalContext在标准化的层次结构中尽可能最低的年代地层时期实例。使用dwciri: earliestGeochronologicalEra指向收集编目物品的最早地质时期和对象属性dwciri: latestGeochronologicalEra指向收集编目物品的最近可能的地质时期。创建IRI的组织应该将这些时间段与层次结构中的更高级别联系起来。方法定义的IRIs是推荐的最佳实践国际地层学委员会.控件中的受控值的来源列表达尔文核心信息辅助网页.看到部分2.7.6使用的细节。
dwciri: fromLithostratigraphicUnit 用于连接dwc: GeologicalContext实例的一个iri识别的岩石地层单元在一个层次的最低可能的水平。预计这些资源将由制造IRI的组织与层次结构中的更高级别联系起来。看到2.7.7节使用的细节。
dwciri: inDataset 提供此对象属性是为了将主题数据集记录链接到包含它的数据集。可以使用术语提供数据集的字符串字面值名称dwc: datasetName

3.7dwc:类中有类似项的命名空间术语dwciri:名称空间(规范)

达尔文核心项有一个dwciri:具有相同本地名称的模拟程序 笔记dwciri:类似物
dwc: recordedBy
dwc: identifiedBy
dwc: georeferencedBy
dwc: measurementDeterminedBy
对象是一个代理;中受控值的来源列表中引用的IRI达尔文核心信息辅助网页
dwc: locationAccordingTo 对象是代理或发布。尽可能使用知名的IRI,例如http代理的DOI。
dwc: georeferenceProtocol
dwc: georeferenceSources
dwc: samplingProtocol
对象是已出版的或众所周知的引用;使用IRI版本(最好是HTTP代理)的doi, isbn, issn等,如果有的话。
dwc:性
dwc: lifeStage
dwc: reproductiveCondition
dwc: establishmentMeans
dwc:行为
dwc: occurrenceStatus
dwc:性格
dwc: verbatimCoordinateSystem
dwc: verbatimSRS
dwc: geodeticDatum
dwc: georeferenceVerificationStatus
dwc: footprintWKT
dwc: footprintSRS
dwc: lowestBiostratigraphicZone
dwc: highestBiostratigraphicZone
dwc: identificationVerificationStatus
dwc: identificationQualifier
dwc:准备工作
dwc: typeStatus
dwc: measurementType
dwc: measurementUnit
dwc: measurementMethod
推荐的最佳实践是使用受控词汇表(如果有的话)。
dwc: informationWithheld
dwc: dataGeneralizations
dwc:栖息地
如果对象属性(dwciri:使用的是Analogue)而不是dwc:属性,对象属性应该指向一个稳定的资源,该资源可能是受控词汇表。
dwc: fieldNumber
dwc:情感涉
dwciri: fieldNumber是一个对象属性,其主题是字段注释的资源(可能是iri识别的),其对象是dwc:事件实例。dwciri:情感涉对象属性的主题是dwc:事件实例,其对象是一个(可能是iri识别的)资源,即字段注释。
dwc:记数字 dwciri:记数字是一个对象属性,其主题是一个事件,其对象是一个(可能是iri识别的)资源,该资源是字段注释。

3.8达尔文核心术语,本指南不建议使用dwciri:对象财产(规范)

达尔文的核心词 笔记
dwc: relationshipOfResource
dwc: relationshipAccordingTo
组织下的术语的非rdf使用dwc: ResourceRelationship类依赖于的值dwc: resourceID而且dwc: relatedResourceID中讨论的原因,这些术语不能在RDF中使用2.6节.截至2014年11月,RDF/OWL任务组正在寻找一种将资源关系表示为RDF的方法。就目前而言,dwciri:这两个术语没有采用类似的说法。看到达尔文核心信息辅助网页为进一步讨论。
dwc: associatedOccurrences
dwc: associatedMedia
dwc: associatedSequences
dwc: associatedTaxa
dwc: associatedOrganisms
使用使用dc:关系而且rdf: type,或表示更具体的关系的术语,如2.8节(达尔文核心协会术语)。
dwc: previousIdentifications 没有将标识与其他类的资源相关联的一致对象属性。无论选择何种方案来提供对象属性,都要使用与最近标识相同的对象属性,但要提供更早的dwc:dateIdentified值。
dwc: organismScope 使用rdf: type用一个非文字对象。请在http://rs.tdwg.org/dwc/terms/organismScope查看评论。
  1. 推荐格式是ISO 8601:2004 (E).有关日期条款的注释见3.4节为进一步的信息。

  2. 这些使用dc:名称空间术语有域声明。

  3. 有关推荐的控制值,请参阅文档“知名控制值IRIs的来源”,可从达尔文核心信息辅助网页

  4. 有关将创意作品与其许可证链接的更多信息,请参阅文档“知名受控价值IRIs的来源”达尔文核心信息辅助网页

  5. 的字面对象模拟使用dc:许可证奥杜邦的核心建议xmpRights: UsageTerms文字。

  6. 的字面对象模拟使用dc:权力奥杜邦的核心建议xmpRights:老板文字。然而,由于xmpRights:老板定义为XMP规范作为“资源的合法所有者列表”,它只能用于指定权限所有者,而不能用于管理权限的代理。

  7. 看到DCMI accessRights指南了一个例子。

  8. 由Darwin Core定义的所有Darwin Core术语(与从Dublin Core导入的术语相反)都没有将域或范围声明作为其定义的一部分。然而,五项在dwc:上表中列出的命名空间定义为rdfs: subPropertyOf使用dc:日期,它具有范围rdfs:文字.的第7.3.1节所列的扩展蕴涵规则ext4RDF语义2004 W3C推荐,可以推断出这些项具有值域rdfs:文字.然而,RDF 1.1语义W3C推荐不包括这些外延蕴涵规则。然而,有理由期望日期属性应该具有文字值,并尽可能使用数据类型属性。