简单的达尔文核心
- 标题
- 简单的达尔文核心
- 版本发布日期
- 2021-07-15
- 创建日期
- 2009-04-21
- TDWG标准的一部分
- //www.nancyp.com/standards/450/
- 这个版本
- http://rs.tdwg.org/dwc/terms/simple/2021-07-15
- 最新版本
- http://rs.tdwg.org/dwc/terms/simple/
- 之前的版本
- http://rs.tdwg.org/dwc/terms/simple/2014-11-08
- 摘要
- 本文档是Simple Darwin Core标准的参考文档。
- 贡献者
- John Wieczorek (MVZ), Markus Döring (GBIF), Renato De Giovanni (CRIA), Tim Robertson (GBIF), Dave Vieglais (KUNHM)
- 创造者
- 达尔文核心任务组
- 书目引文
- 达尔文核心维护组,2021年。简单的达尔文的核心。生物多样性信息标准。http://rs.tdwg.org/dwc/terms/simple/2021-07-15
1介绍
简单达尔文核心是一个预定义的术语子集,在广泛的生物多样性应用程序中有共同的使用。简单达尔文核心中使用的术语是那些在分类名称、地点和事件的横截面上发现的,这些都记录了地球上的生物事件。两个驱动原则是简单性和灵活性。
1.1本文档内容的状态
除了第5节,本文件的所有章节都是非规范性的(解释性的)。
1.1.1 RFC 2119关键字
本文件中的关键字“必须”、“不得”、“必需”、“应”、“不应”、“应”、“不应”、“建议”、“可能”和“可选”应按照RFC 2119.
2的观众
本文档针对那些希望使用简单的方法和结构来共享生物多样性信息的人:Simple Darwin Core。它解释了这种结构的用途和限制,以及如何扩展它。
是什么让它变得简单?
Simple Darwin Core之所以简单,是因为它假设(并允许)除了行和列的概念之外没有任何结构,行和列可以被认为是属性和它们的值,或者字段和记录。单词字段和记录将在文档的其余部分中使用,以引用Simple Darwin Core结构的两个维度。可以将术语名称视为字段名称。换句话说,Simple Darwin Core记录可以在电子表格或单个数据库表中捕获。
是什么使它具有灵活性?
对于哪些字段是强制性的,Simple Darwin Core有最小的限制(没有)。您可能认为应该有更多的强制字段,没有它们就没有任何有用的功能。这是部分正确的。没有字段的记录不会很有趣,但要求在记录中有字段和要求在所有记录中有特定字段是有区别的。由于没有强制性的字段限制,Simple Darwin Core可以用于共享任何有意义的字段组合——例如,共享“只是名称”或“只是地点”,或者在给定的地点和时间按照某种方法(事件)在野外发现的个体的观察结果。这种灵活性促进了术语的重用和各种服务的共享机制。
5 .有什么规定吗?(规范)
这里有一些关于如何最好地使用Simple Darwin Core的一般指导原则:
- 任何Darwin Core术语名都可以用作字段名。
- 字段名绝对不能在记录中重复。
- 类名(例如,
发生,生物)绝对不能用作字段名。 - 应该尽可能多地提供数据。
- 的
dc:类型字段应该用最合适的Dublin Core类型类的名称填充(PhysicalObject,StillImage,MovingImage,声音,文本)记录表示。 - 的
basisOfRecord应该使用最特定的Darwin Core类的名称(LivingSpecimen,PreservedSpecimen,FossilSpecimen,MaterialSample,HumanObservation,MachineObservation,MaterialCitation,事件,发生,分类单元,生物,位置,GeologicalContext)记录表示。 - 应该使用与字段定义匹配的数据填充字段。
- 推荐的受控词汇表的值应该用于推荐该词汇表的字段的值。
- 如果数据被保留,字段
informationWithheld应该这样说。 - 如果共享的数据质量低于原始数据,则字段
dataGeneralizations应该这样说。
简单达尔文核心中的每个字段可能出现一次,也可能没有出现在单个记录中——否则你怎么能区分一个字段呢scientificName另一场吗?考虑一个数据库表。它不允许对两个不同的字段使用相同的名称。由于这种设计限制(为了简单而缺乏灵活性),辅助字段从MeasurementOrFact和ResourceRelationship类在这里的效用有些有限——您只能共享一个类MeasurementOrFact和一个ResourceRelationship每个记录。你可能会说那么有没有办法实现信息共享,需要相关的结构,如样品标识的历史。这主要是真实的。唯一的简单的达尔文核心内的办法是将数据强行进入渔获一个所有“名单”的术语如recordedBy,准备工作,otherCatalogNumbers,associatedMedia,associatedReferences,associatedSequences,associatedTaxa,associatedOccurrences,associatedOrganisms,previousIdentifications,higherGeography,georeferencedBy,georeferenceSources,identifiedBy,identificationReferences,higherClassification.
在字段中包含数据和要求该字段从一组合法值中获取值是有区别的。Darwin Core很简单,因为它对字段的内容有最小的限制。术语注释提供了关于受控词汇表的使用以及如何适当地组织内容的建议。我们鼓励数据贡献者尽可能地遵循这些建议。您可能会说,没有限制将会促进“脏”数据(低质量或价值可疑的数据)。想想这个简单的公理:“重要的不是你拥有什么,而是你用它来做什么。”如果在基础级别有数据限制,那么在其任何字段中有任何不合规数据的记录就不能通过标准共享。不仅会有缺乏共享数据在这种情况下(或一个未使用的标准),也就没有办法使用标准构建共享数据清洗工具来改善这种情况,也不使用数据服务来查找替代表示(例如,语言翻译)更广泛的受众。其余是将如何使用记录——换句话说,它取决于应用程序执行进一步限制在适当的情况下,它的利益相关者是那些应用程序决定的限制将应用程序的目的是试图服务。
6如何使用Simple Darwin Core?
Darwin Core是简单的,因为“遵从”simple Darwin Core的数据可以很容易地以各种方式共享,包括但不限于文本文件和xml文档。本节将介绍共享相同数据的等效方法简单的达尔文核心作为文本和简单的Darwin Core作为XML.
你需要做的是通过简单达尔文核心数据的贡献是什么依赖于那些谁是要消耗这些数据的要求。举例来说,如果你有谁愿意通过简单达尔文核心共享数据的合作者,那么它可能足以创建包含你都感兴趣的共享列标题匹配尽可能多的达尔文核心术语名称的电子表格 - 只是为了确保你都了解你共享字段的含义,因此希望一些关于他们的内容。你也许可以在使用简单达尔文核心的模型数据库中的表(如果它满足您所有的需求),然后用服务连接该数据库通过网络共享。你可能会使用同一个数据库(或电子表格),以逗号分隔值(CSV)上传文件导出到一个托管服务,可以成为代表您的数据。或者,你可能会使用相同的文件上传到服务,将允许您添加值(如地理参考)或质量(与数据清洗工具),或看到其他共享数据的上下文数据。
6.1简单的达尔文核心作为文本
的文字指导属性的简化子集描述如何构造文本文件并对其格式化了文本规范,它允许贡献者通过一个单独的配置文件(称为元文件)描述一个文本文件或一组文本文件(相关或不相关)的内容。元文件允许贡献者交流文件内容的结构以及它们之间的任何关系。虽然用这样的元文件来描述Simple Darwin Core文件是一种很好的实践,但是如果文件遵循CSV文件规范,并且文件的第一行包含字段名,那么就没有严格的必要了。一个了文本基于Simple Darwin Core的任何文本文件的元文件可以通过自定义示例图元文件,其中包括对所有达尔文核心术语的引用。中引用文件本身中的注释以及元文件规范文字指导为更多的信息。
6.2简单的Darwin Core XML
的XML指南描述如何构造XML模式以基于Darwin Core术语共享数据。看简单的Darwin核心XML模式使用XML指南作为参考,您将能够看到模式支持a的概念SimpleDarwinRecord,这仅仅是一个向上的分组到每个属于达尔文核心术语中的一个属性(不类).
6.2.1将Simple Darwin Core作为XML的示例
下面的例子显示了一个SimpleDarwinRecordSet包含一个SimpleDarwinRecord对于一个分类单元:
<?xml version = " 1.0 " encoding = " utf - 8 " ?>< SimpleDarwinRecordSetxmlns =“http://rs.tdwg.org/dwc/xsd/simpledarwincore/”xmlns: dc =“http://purl.org/dc/terms/”xmlns: dwc =“http://rs.tdwg.org/dwc/terms/”xmlns: xsi =“http://www.w3.org/2001/XMLSchema-instance”xsi: schemaLocation =“http://rs.tdwg.org/dwc/xsd/simpledarwincore/ http://rs.tdwg.org/dwc/xsd/tdwg_dwc_simple.xsd”>< SimpleDarwinRecord >< dc:修改>2006 - 05 - 04 - t18:13:51.0z> < / dc:修改< dc:语言>在> < / dc:语言< dwc: basisOfRecord >分类单元< / dwc: basisOfRecord >< dwc: scientificNameID >http://research.calacademy.org/research/ichthyology/catalog/fishcatget.asp?spid=53548< / dwc: scientificNameID >< dwc: acceptedNameUsageID >http://research.calacademy.org/research/ichthyology/catalog/fishcatget.asp?spid=22010< / dwc: acceptedNameUsageID >< dwc: originalNameUsageID >http://research.calacademy.org/research/ichthyology/catalog/fishcatget.asp?spid=53548< / dwc: originalNameUsageID >< dwc: nameAccordingToID >http://research.calacademy.org/research/ichthyology/catalog/getref.asp?id=22764< / dwc: nameAccordingToID >< dwc: namePublishedInID >http://research.calacademy.org/research/ichthyology/catalog/getref.asp?id=671< / dwc: namePublishedInID >< dwc: scientificName >Centropyge flavicauda Fraser-Brunner, 1933< / dwc: scientificName >< dwc: acceptedNameUsage >Centropyge fishi (Snyder 1904)< / dwc: acceptedNameUsage >< dwc: parentNameUsage >Centropyge Kaup 1860< / dwc: parentNameUsage >< dwc: originalNameUsage >Centropyge flavicauda Fraser-Brunner, 1933< / dwc: originalNameUsage >< dwc: nameAccordingTo >艾伦,1980年广义相对论。蝴蝶和天使的世界。卷二世。Mergus出版商。149 - 352页。< / dwc: nameAccordingTo >< dwc: namePublishedIn >Fraser-Brunner, a . 1933。鲳鲹亚科毛齿鱼的订正。伦敦动物学会科学业务大会论文集(第3期,第30期):543-599,第1页。< / dwc: namePublishedIn >< dwc: higherClassification >动物界,脊索动物门,脊椎动物门、硬骨鱼纲、辐鳍鱼纲;Neopterygii; Teleostei;棘鳍总目,鲈形目;Percoidei; Pomacanthidae Centropyge< / dwc: higherClassification >< dwc:王国>动物类> < / dwc:王国< dwc:门>脊索动物< / dwc:门>< dwc:类>硬骨鱼纲< / dwc:类>< dwc:订单>鲈形目> < / dwc:秩序< dwc:家庭>Pomacanthidae< / dwc:家庭>< dwc:属>Centropyge< / dwc:属>< dwc: specificEpithet >flavicauda< / dwc: specificEpithet >< dwc: scientificNameAuthorship >Fraser-Brunner 1933< / dwc: scientificNameAuthorship >< dwc: taxonRank >物种< / dwc: taxonRank >< dwc: nomenclaturalCode >委员会< / dwc: nomenclaturalCode >< dwc: taxonomicStatus >接受< / dwc: taxonomicStatus >< / SimpleDarwinRecord >< / SimpleDarwinRecordSet >
的SimpleDarwinRecord作为一个类因为所有的项都是它的属性。简单达尔文核心模式只有另一个层次的结构,即SimpleDarwinRecordSet,它是一个或多个组合SimpleDarwinRecords.的SimpleDarwinRecordSet作为一个类在实现期间定义数据集。
7用简单的Darwin Core做更多
迟早你会想要分享比Simple Darwin Core所允许的更多的信息。例如,您和您的同事可能会认为,有一种标准的方式来交换与《自然保护》中问题相关的额外信息是有用的。你会怎么做?
一种方法是通过使用他们举行比基于术语的定义意图是什么等信息,尝试“过载”现有条款。请不要这样做。If an existing term has close to the same meaning as one you want to use, but just doesn’t quite fit because of the way the definition is worded, it would be better to request an amendment to the term definition so that it will be clear for your community how to use it. You can request such a change by submitting an issue in the达尔文核心存储库.
7.1使用dynamicProperties的结构化内容
另一种不添加术语就能从达尔文中心得到更多信息的方法是“有效载荷”dynamicProperties术语与结构化内容,如下面的示例所示,使用Javascript Open Notation (JSON)。这是完全合法的,因为它并没有损害术语的含义。以这种方式加载数据的缺点之一是缺乏稳定的或定义良好的语义。此外,强烈建议将内容压缩为单个字符串,不包含非打印字符(如换行符),以便在最广泛的数据共享上下文中使用。尽管如此,这可能是一种合理的方式,至少允许您共享所有数据,即使可能存在人们可靠地使用它的问题。
7.1.1 XML中的结构化JSON内容示例
<?xml version = " 1.0 " encoding = " utf - 8 " ?>< SimpleDarwinRecordSetxmlns =“http://rs.tdwg.org/dwc/xsd/simpledarwincore/”xmlns: dc =“http://purl.org/dc/terms/”xmlns: dwc =“http://rs.tdwg.org/dwc/terms/”xmlns: xsi =“http://www.w3.org/2001/XMLSchema-instance”xsi: schemaLocation =“http://rs.tdwg.org/dwc/xsd/simpledarwincore/ http://rs.tdwg.org/dwc/xsd/tdwg_dwc_simple.xsd”>< SimpleDarwinRecord >< dc:修改>2009 - 02 - 12 - t12:43:31> < / dc:修改< dc:语言>在> < / dc:语言< dwc: basisOfRecord >分类单元< / dwc: basisOfRecord >< dwc: scientificName >Ctenomys sociabilis< / dwc: scientificName >< dwc: acceptedNameUsage >皮尔逊和克里斯蒂,1985年< / dwc: acceptedNameUsage >< dwc: parentNameUsage >Ctenomys Blainville 1826< / dwc: parentNameUsage >< dwc: higherClassification >动物界;脊索动物;脊椎动物门;哺乳动物;真兽亚纲;真兽亚纲;啮齿目;Hystricognatha;Hystricognathi;Ctenomyidae; Ctenomyini; Ctenomys< / dwc: higherClassification >< dwc:王国>动物类> < / dwc:王国< dwc:门>脊索动物< / dwc:门>< dwc:类>哺乳动物< / dwc:类>< dwc:订单>啮齿目> < / dwc:秩序< dwc:家庭>Ctenomyidae< / dwc:家庭>< dwc:属>Ctenomys< / dwc:属>< dwc: specificEpithet >sociabilis< / dwc: specificEpithet >< dwc: taxonRank >物种< / dwc: taxonRank >< dwc: scientificNameAuthorship >皮尔森和克里斯蒂,1985年< / dwc: scientificNameAuthorship >< dwc: nomenclaturalCode >委员会< / dwc: nomenclaturalCode >< dwc: namePublishedIn >皮尔森和克里斯蒂,1985。史学家自然,5 (37):388< / dwc: namePublishedIn >< dwc: taxonomicStatus >有效的< / dwc: taxonomicStatus >< dwc: dynamicProperties >{“iucnStatus”:“脆弱”,“分布”:“Neuquen,阿根廷”}< / dwc: dynamicProperties >< / SimpleDarwinRecord >< / SimpleDarwinRecordSet >
7.2通过添加术语扩展Darwin Core
如果您只是使用CSV文本文件来交换信息,那么您可能会忍不住向文件中添加新字段。这种方法会遇到与有效加载相同的问题——除了那些与你沟通的人之外,没有人知道这些新字段是什么或者如何使用它们。以这种方式通过XML共享将是一个更大的问题,因为简单的Darwin核心XML模式定义它支持的术语,并且新字段不与模式理解的任何术语相对应。换句话说,包含字段的XML将不是有效的Simple Darwin Core XML文档。
因此,如果您真的需要扩展Darwin Core的功能,那么最好的第一步是遵循标准流程添加您需要的术语。看到贡献指南理解如何提出一个新术语。
8超越简单的达尔文核心
对于富数据需要富(非简单)结构的情况,单独使用Simple Darwin Core并不合适。当通过了文本,解决方案是使用Simple Darwin Core作为核心记录,并为附加信息提供一个或多个关联扩展。看到文字指导以作解释和举例。
当通过XML.,更丰富的结构,如生物收集数据访问模式(ABCD),或通用的达尔文核心,或根据Darwin Core术语构建的另一种模式,以适应特定上下文中数据的使用。看到XML指南以获取模型模式的示例和引用。
