Saturday, 3 March 2018

다윈 핵심 전략 다변화


힘과 자신감으로 투자하십시오.


"자본은 원하는 곳에 흐르고 잘 치료받는 곳에 머무를 것" & # 8211; 월터 리스튼.


벤치 마크.


인기있는 Bechmarks (반월 로그 차트 2002-2012, 오른쪽에 CAGR)


Gary Antonacci 벤치 마크 (2002-2012 월간 월간 로그 차트, 오른쪽의 CAGR) & # 8211; 최적 모멘텀으로부터 글로벌 밸런스 모멘텀 인덱스 (GBMI) 및 리스크 패리티 모멘텀 컴포지트 (RPMC).


절대 수익률 벤치 마크 (2004-2012 월간 월간 로그 차트, 오른쪽의 CAGR)


더 많은 절대 수익 벤치 마크 (출시 예정)


Mebane Faber (IVY 포트폴리오) & # 8211; 회전 시스템 & # 8211; 5 자산, 월간, 평균 3,6,12 개월 수익, 상위 1, 2 및 3 자산을 사용합니다.


다윈 펀드 & # 8211; 다윈 핵심 다각화 전략 (6 % 및 8 % 변동성 목표, 2 % 관리 수수료 순증)


Acorn Global Investments & # 8211; 도토리 다각화 된 신뢰 (경영진 2 % 및 성과 수수료 20 % 순회)


이진 옵션 전략 가격 행동.


1 분 바이너리 옵션.


다윈 핵심 전략 다변화


게슈탈트에서 우리는 자신을 점진 주의자로 본다. 물론 다양한 이론의 분야에서 거대 전략이 있습니다. Markowitz, Black, Sharpe, Thorpe 및 Litterman과 같은 영원한 유명인 외에도 Thierry Roncalli, Attilio Meucci 및 Yves Choueifetay와 같은 다윈의 사상가는 현대의 거성이 될 것입니다. 우리는 휴리스틱 최적화 분야에서의 기여와 순수 재무 및 수학 분야 이외의 분야에서 다양 화를 소개하려는 그의 경향에 대해 David Varadi의 업적을 존경합니다. 또한 마이클 카플러 (Michael Kapler)는 체계적인 전략 툴킷을 통해 다각화 된 진정한 창발 현상을 창출했습니다. 이전에는 정교한 금융 분야를보다 광범위한 실무자에게 개방했습니다. 나는 결코 아주 좋은 전략 이름이 아니었다. 이 기사에서는 강력 위험 패리티에 대한 기사에서 소개 한 클러스터 개념을 지난 몇 달 동안 바라 티와 카플러가 제안하고 조사한 아이디어와 통합하고자합니다. 솔직히 창의적인 프로세스에서 자주 발생하는 것처럼 우리는 생산 알고리즘에 대한 Monte-Carlo 기반의 견고성 테스트를 설계하는 과정에서 이러한 아이디어를 찾았습니다. 우리는 더 자세하게 탐구하여 향후 게시물을 핵심으로 삼을 것입니다. Varadi는 R. Gutierrez-Osuna의 다음 슬라이드를 사용하여이 개념을 설명했습니다. 회보 빈도 매일 매주. 암호를 잊으셨습니까? 홈 ETFs 전략 SIA 차트 다윈 캐나다 섹션 캐나다 시장 새로운 대안 U. 주식 유럽 - 섹션 코어 신흥 시장 투자 중국 BRIC ETFs 수익 가치 투자 수동 전략 다우닝 시장 채권 기업 채무 신용 시장 EM 채권 높은 수익률 해설 A - J AllianceBernstein Algonquin Diversified 애로우 캐피탈 매니지먼트 빌 그로스 브룩 스커크 데이비드 로젠버그 돈 비알 루 피델리티 투자 캐나다 프랭크 홈즈, 미국 펀드 조지 소로스 가이 하젤 만 휴즈 헨 드리 인 베스코 캐나다 제프리 건 드락 제프리 새트, 레이몬드 제임스 제레미 그랜 탐, GMO L - Z 리즈 앤 Sonders LPL 금융 마퀘스트 자산 다각화 된 Inc . Mawer Investment Management 새로 발견 된 연구 목적 투자 Ray Dalio Asset Management 다각화 된 Koesterich, Blackrock Ryan Lewenza, Raymond James Sentry 투자 William Smead Som Seif, 다윈 투자 Warren Buffett WealthTrack Practice 성장 고문 - 부문 교육 회사 소개 이용 약관 개인 ​​정보 보호 정책 Po 우리와 함께 광고하기 구독하기 CE. 메뉴 홈 ETFs 주식 전략 챠트 시장 캐나다 섹션 캐나다 시장 새로운 대안 미국 포트폴리오 관리 개념으로 '클러스터 축소'를 살펴보십시오. Positive Neutral Negative 확실하지 않음 결과보기. 페이지 1 중 8 : 태그 Adam Butler 적응 형 자산 배분 자산 관리 채권 시장 핵심 클러스터 축소 경제 GestaltU Mike Philbrick 다각화 된 자산 관리 다윈 Gordillo 주식 미국 주식. 이전 기사 Alfred Lee : Darwin 율 Tug-of-War. 다음 기사 일반 전략 CORP GD NYSE - 4 월 9 일, 불편 함을 느끼면서 편안함, 핵심 가치 평가 5 월 5 일, 자산 배분은 희소 한 심장 긴 생애 1 월을위한 것이 아닙니다, 추수 감사절 터키의 삶 : 투자 전설 11 월 17 일 , Darwin Dollar Upticks 금리의지지없이 깨지기 쉬운 Marc Chandler 6 월 24 일, 변경된 내용 Core Chandler 6 월 23 일 Business의 Ned Darwin 마스터스 인터뷰 Business Bloomberg의 핵심 Barry Ritholtz 6 월 23 일 Active Stock Picker Tom Gardner가 왜 우리 대부분을 추천합니까? 수동 전략 기금에 투자하십시오? Consuelo Mack, WealthTrack 6 월 23 일, 자료에 따르면 Fed가 실수를 저지르고 있다고합니다 Lance Roberts, Clarity Financial 6 월 23 일 이름 처음 핵심 뉴스 레터 빈도 일간 주간 주소 :


스탠포드 대학교 포트폴리오 관리 강좌.


Darwin 핵심 다양 화 전략 & rdquo;


1991 년 걸프전은 사진과 함께 텔레비전의 힘에 대한 더 많은 증거를 제공했다.


그의 어머니가 그에게 음식의 사치를 허용했을 때, 심지어 개가 먹기를 거절 한 버릇없는 스크랩 이상의 것이 아니 었습니다.


그의 조상 Juan De Grijalva는 1500 년대 뉴 스페인에 왔습니다.


나의 사이트가 스페인 반 영어의 반이었다고해도 그것은 일했다.


다윈 코어.


참조 정의, 예제 및 주석을 제공함으로써 생물 다양성에 관한 정보의 공유를 용이하게하기위한 용어집 (다른 문맥에서는 속성, 요소, 필드, 열, 속성 또는 개념이라고도 함)을 포함한 표준 본문 .


생물 다양성 정보 표준 (TWDG)이 후원하는이 표준은 2009 년 10 월에 마지막으로 수정되었습니다.


확장 기능.


Herbinia에 대한 Darwin Core 문서 및 권장 사항.


다윈 코어에 대한 지형 공간 확장을위한 프로토콜 독립적 인 XML 스키마.


Darwin Core 표준의 확장으로, 식물 유전자 원 및 특히 생식 질 씨앗 샘플을 설명하는 데 필요한 추가 용어가 포함됩니다.


GBIF 네트워크에 제공하고자하는 데이터 게시자에게 데이터 요소를 기본 텍스트 파일로 설명하기위한 쉬운 인터페이스를 제공하는 웹 응용 프로그램. 적절한 XML Darwin Core 설명자 파일을 작성하여 기본 텍스트 파일로 제공합니다.


다윈 핵심 텍스트 지침 (Darwin Core Text Guidelines)에 대한 XML 메타 데이터를 검증하는 도구.


Darwin Core 및 EML을 사용하는 소프트웨어 플랫폼으로 GBIF 네트워크를 사용하여 인터넷에서 생물 다양성 데이터를 효율적으로 게시 할 수 있습니다.


박물관, 식물 표본관, 지역 사회 단체, 정부 부서, 개인 및 대학에서 수집 한 호주의 모든 알려진 종에 대한 정보를 모았습니다. 모든 데이터는 Darwin Core로 변환됩니다.


GBIF는 국가 및 조직의 글로벌 네트워크에 의해 설립되었으며, 생물 다양성 데이터의 동원, 접근, 발견 및 사용을 촉진하고 촉진하는 웹 포털입니다. GBIF 네트워크에 데이터를 게시하는 데 선호되는 형식은 Darwin Core Archive이며 통합 Publishing Toolkit은 데이터 표준으로 EML을 사용합니다.


전 세계 바다의 해양 생물 데이터 세트를 저장하는 데이터 저장소. Darwin Core 2의 확장을 데이터 표준으로 사용합니다.


Madagascar에서 수집 한 생물 다양성 데이터를 설명하기 위해 Darwin Core를 사용하는 웹 포털.


Darwin Core 엔진을 사용하는 4 개의 분산 데이터베이스 네트워크 (MaNIS, HerpNET, ORNIS 및 FishNet)는 생물 정보학 표본 데이터를 상호 운용 가능하고 매핑 가능하며 공개적으로 사용할 수 있도록합니다.


다윈 코어 RDF 가이드.


1. 소개.


Darwin Core [DWC]를 사용하여 정보를 인코딩하는 각각의 방법에는 그 상황에서 Darwin Core 용어를 사용하는 방법을 설명하는 가이드가 있습니다. 이것은 자원 기술 프레임 워크 [RDF]를 사용하여 생물 다양성 데이터를 인코딩하는 가이드입니다.


1.1 청중.


Darwin Core RDF 가이드는 RDF를 사용하여 Darwin Core (DwC) 속성에 기술 된 생물 다양성 데이터를 공유하고자하는 사람들을 대상으로합니다. RDF를 사용하는 자원에 관한 기본 정보를 표현하는 커뮤니티 베스트 프랙티스가 Darwin Core 용어와 관련되는 방법을 설명하고 다윈 코어 용어가 리터럴 (문자열) 및 비 리터럴 (IRI 참조) 객체로 RDF에서 사용되는 방법을 명확히 설명합니다. RDF의 모델과 구문을 설명하기위한 것은 아닙니다. 생물 다양성 관련 RDF에 대한 일반적인 소개는 [RDF-BEGINNERS-GUIDE]를 참조하십시오. RDF에 대한 더 자세한 소개는 [RDF-PRIMER]를 참조하십시오.


1.2 이론적 근거.


다윈 코어 (Darwin Core)는 생물 다양성 영역에서 RDF로 알려진 개체의 속성과 유형을 기술하는 데 사용할 수있는 용어를 제공하는 어휘입니다. Darwin Core는 여러 가지 데이터 전송 시스템의 일부로 사용될 수 있기 때문에 범용 어휘입니다. RDF는 DwC 사용 안내서가있는 다른 데이터 전송 시스템 ([TEXTGUIDE] 및 [XMLGUIDE])과 몇 가지 중요한 점에서 다릅니다. RDF는 본질적으로 분산 시스템입니다. 한 공급자의 데이터가 다른 공급자의 데이터에 연결되는 것으로 가정합니다. 이는 또한 특정 자원에 대한 새로운 데이터 특성을 항상 발견 할 수 있으며 익숙하지 않은 용어를 사용하여 해당 특성을 설명 할 수 있음을 의미합니다. 이는 송신자와 수신자 사이에 데이터의 형식과 조직의 구성 및 용어 해석에 대한 사전 합의가 있어야하는 다른 데이터 전송 시스템과 크게 다릅니다 (연합 스키마 또는 사람이 이해할 수있는 문서 형태로) 기록 안에서. RDF는 기계 (실제로는 시맨틱 클라이언트 또는 "클라이언트"라고하는 컴퓨터 프로그램)에 의한 데이터 및 메타 데이터 검색을 용이하게하기위한 것이므로 인간의 개입없이 클라이언트가 용어의 의미와 사용을 명확하게 정의하고 발견 할 수 있어야합니다. 서로 다른 데이터 공급자 간의 자원을 상호 참조 할 수 있도록 자원은 국제화 된 자원 식별자 (IRI)라고하는 표준화되고 기계가 이해할 수있는 고유 한 식별자를 사용하여 식별해야합니다. 마지막으로, 누구나 사전에 정의 된 스키마에 동의하지 않고도 자원에 관한 진술을 할 수 있기 때문에 RDF의 본성은 매우 평범한 관계 네트워크이며 그 특성상 평평한 전형적인 데이터베이스 테이블과는 다릅니다. 이러한 차이점 때문에 RDF를 효과적으로 사용하려면 사용자가 식별자, 데이터 전송 프로토콜 및 어휘 적용에 대한 본질적으로 진화하는 사회 관례에 충실해야합니다. 이러한 규칙 중 일부는 다음 절에서 설명합니다.


1.3 RDF의 특징.


이 절에서는 RDF의 기본 기능에 대해 설명합니다. RDF에 대한 튜토리얼이 아니며 RDF의 Darwin Core 사용에 대한 특정 지침이 필요한 이유와 추가 Darwin Core 네임 스페이스가 왜 만들어 졌는지 설명하기 위해 RDF 기능에 대한 충분한 정보를 제공하는 것입니다.


1.3.1 직렬화 및 구문.


RDF 모델 자체는 특정 직렬화 구문과는 독립적입니다. 다음 다이어그램은 인간이 쉽게 이해할 수있는 그래픽 형식의 이미지에 대한 사실 집합을 나타냅니다.


각 화살표는 RDF에서 "트리플"이라고하는 이미지에 대한 설명을 나타냅니다. 트리플 세트는 RDF 그래프라고합니다. 자원 (타원으로 표시)은 IRI에 의해 식별됩니다. 설명 된 리소스 (이 예제에서는 화살표 꼬리 부분의 이미지 bioimages. vanderbilt. edu/kirchoff/ac1490)를 트리플의 제목이라고합니다. 주제 리소스의 속성은 여기에 표시된 용어 IRI로 식별되며 이름 공간은 축약됩니다 (예 : dcterms : = "purl. org/dc/terms/"). 이 속성은 트리플의 술어라고합니다. 속성의 값을 사각형의 문자 값 (텍스트로 구성)과 함께 명령문의 개체라고합니다.


이 RDF 그래프는 Terse RDF Triple Language (Turtle) [TURTLE]이라고하는 다소 인간 친화적 인 구문으로 직렬화 할 수 있습니다.


다음은 RDF / XML 구문 [RDF-XML-SYNTAX]의 그래프입니다.


이 문서에서는 다음과 같은 형식 규칙이 사용됩니다. 전체 IRI는 Courier 유형으로 표시되며 꺾쇠 괄호로 묶습니다 (예 :


축약 된 UIRI는 다음과 같은 네임 스페이스 형식의 이탤릭체로 표시됩니다 : localName, 예 : rdf : type. 이름 공간 약어는 자체로 표시 될 때 기울임 꼴로도 표시됩니다 (예 : dwc :). 예제는 Courier 유형으로 표시됩니다.


XML은 널리 이해되는 RDF 직렬화 형식입니다. 따라서 여기에 제시된 모든 예제는 RDF / XML로 표시됩니다. 대부분의 경우 거북에 표시됩니다. RDF 직렬화에 대한 자세한 내용은 RDF 초보자 안내서 [RDF-BEGINNERS-GUIDE]의 제 3 부와 거기에 인용 된 참고서를 참조하십시오.


1.3.2 IRI (Internationalized Resource Identifier)


데이터 제공 업체는 제공하려는 리소스를 나타 내기 위해 다양한 식별자를 사용합니다. 이러한 식별자는 공급자의 데이터베이스 내에서 로컬로 고유하거나 전역 적으로 고유 할 수 있습니다. 제공자는 "Darwin Core Triplets"(institutionCode : collectionCode : catalogNumber) 및 UUIDs [UUID]와 같은 수단을 통해 자신의 식별자를 세계적으로 고유하게 만들려고 노력했습니다. 그러나 IRI [IRI] 형식의 식별자 만 RDF에서 유효한 진술 (RDF 트리플이라고도 함)이 될 수 있으므로 "Darwin Core Triples"이나 UUID는 수정되지 않은 형태로 사용할 수 없습니다. IRI는 IRI [URI] 대신 사용할 수있는 URI (Uniform Resource Identifier)라는 식별자의 더 좁은 형식의 수퍼 집합입니다. 이 문서는 URI가 IRI 대신 사용될 수 있다는 것을 알고 IRI에만 전적으로 참조됩니다.


IRI의 가장 익숙한 형태는 URL을 말합니다. URL은 리소스를 식별 할뿐만 아니라 텍스트와 같은 정보 리소스 (예 : 전자 형식으로 전송할 수있는 리소스) 검색에 대한 정보를 제공합니다. HTML 웹 페이지. 그러나 일반적으로 IRI는 전자적으로 전송할 수없는 비 정보 자원 (물리적 또는 개념적 개체)을 식별 할 수 있습니다 (예 : & lt; bioimages. vanderbilt. edu/contact/kirchoff#coblea> , 사람. 클라이언트가 HTTP IRI를 참조 해제하여 정보가 아닌 자원을 검색하려고 시도하면 컨텐츠 협상 [HTTP-CONTENT-NEGOTIATION]이라는 프로세스가 클라이언트를 비 정보 자원의 정보 자원 표현의 IRI로 참조합니다. 인간의 경우 이는 대개 웹 페이지이며 시맨틱 클라이언트 (기계)의 경우 표현은 RDF / XML 형식의 문서입니다. IRI에 대한 더 자세한 정보는 RDF [RDF-BEGINNERS-GUIDE] 초보자 안내서의 1 부와 거기에 인용 된 참고 문헌을 참조하십시오.


1.3.2.1 영구 식별자.


모범 사례는 영속적 인 관심을 나타내는 리소스를 식별하는 데 사용되는 식별자 (영구 식별자 또는 전역 고유 식별자 : GUID)가 전 세계적으로 고유하고 참조가 일관되며 영구적 인 [GUID-STANDARD]임을 명시합니다. 이러한 식별자가 RDF에서 주체 자원을 식별하는 데 사용되는 경우 IRI 형식이어야합니다. 이는 데이터 제공 업체에게 두 가지 의미가 있습니다.


첫째, IRI가 아닌 전역 고유 식별자가 주체 자원을 식별하는 데 사용되는 경우이를 잘 알려진 IRI 체계 (예 : URN 또는 HTTP IRI) [URI-SCHEMES]에 따라 IRI로 변환해야합니다. . 예를 들어 UUID는 URN [UUID-URN-NAMESPACE]로 문자열 표현 앞에 "urn : uuid :"를 접두어로 사용하여 변환 할 수 있습니다.


이와 유사하게 ISBN은 예 13과 14 에서처럼 URN [ISBN-AS-URN]으로 변환 될 수 있습니다. 이러한 URN이 유효한 IRI이지만 실행 불능이라는 단점이 있습니다 (1.3.2.2 절 참조). 반대로, "Darwin Core triplet"


그것을 기본 문자열 "arctos. database. museum/guid/"에 추가하여 실용적인 IRI로 바꿨습니다.


둘째, 공급자가 리소스에 대한 데이터를 제공하는 URL을 사용하여 리소스를 참조하는 경우 공급자는 URL이 시간이 지남에 따라 변경되지 않도록주의해야합니다 (예 : 콘텐츠가 다른 서버로 이동하는 경우, 디렉터리 구조 변경 사항 또는 새 버전의 데이터베이스가 도입 된 경우). 리소스를 참조하는 영구 IRI에서 리소스를 설명하는 웹 페이지의 URL로 사용자를 리디렉션하기 위해 컨텐트 협상 [HTTP-CONTENT-NEGOTIATION]을 사용하는 것이 좋습니다.


영구 식별자에 대한 자세한 내용은 영구 식별자에 대한 GBIF 초보자 용 설명서 [GUID-GUIDE-GBIF]를 참조하십시오.


TDWG LSID Applicability Statement 표준 [GUID-STANDARD]에 의해 설정된 선례에 근거하여, URN 기반의 IRI는 2.2.3 절에서 설명 된 것처럼 HTTP 프록시에 상응하는 (존재한다면) 관련이있는 것이 권장된다.


1.3.2.2 자체 해결 GUID로서의 HTTP IRI.


Linked Data [LINKED-DATA]의 원칙을지지하는 사람들은 "HTTP IRIs"라고하는 HTTP IRI 체계 [HTTP]를 따르는 식별자를 선호합니다. 세계적으로 유일한 것 외에도 이러한 식별자는 광범위하게 구현 된 프로토콜을 사용하여 역 참조가 가능하다는 장점이 있습니다. 이와 같이 HTTP 최종 사용자가 일반 웹 브라우저를 사용하여 리소스에 대한 정보를 얻을 수 있도록 HTTP IRI를 구현할 수 있습니다. 자원을 기술하는 데이터 (RDF 형태)가 의미 론적 클라이언트에 의해 발견 될 수 있도록 HTTP IRI를 구현하는 것도 가능하다. HTTP IRI가 부여한 이점을 인식하여 TDWG GUID Applicability Statement 표준 [GUID-STANDARD]은 권장 사항 2에서 "비 - Gres - 해결 GUID에 대해 HTTP GET 해상도를 제공해야 함"을 지정합니다. 이러한 이유로 RDF를 통해 데이터를 제공하려는 생물 다양성 정보 제공자는 지속적인 HTTP IRI 인 GUID를 구현해야합니다. 이것은 본 가이드의 2 절에서 설명 된 방법을 사용하여 HTTP IRI와 관련 될 수있는 자체 해결되지 않은 다른 유형의 전역 고유 식별자를 제외하지 않습니다.


1.4 RDF에서 용어 사용.


1.4.1 잘 알려진 어휘.


RDF는 리소스를 설명하는 속성으로 사용되는 용어에 대해 데이터 공급자와 소비자간에 기존 계약이 없다고 가정하기 때문에 공급자가 RDF 트리플의 의미를 "이해할"가능성이 높아집니다. - 알려진 어휘. 일부 잘 알려진 일반 및 생물 다양성 관련 어휘는 RDF 초보자 안내서 [RDF-BEGINNERS-GUIDE]에 나와 있습니다. 리소스를 설명하는 데 필요한 속성을 나타내는 잘 알려진 용어가없는 경우 데이터 공급자는 자체 용어를 "작성"할 수 있습니다. 이 경우 제공자는 IRI라는 용어를 할당하고, RDF로 용어를 정의하고, 용어가 어떻게 사용되어야하는지에 대한 인간이 이해할 수있는 명확한 문서를 제공하고, IRI의 참조 해제를 제공하며, 용어 IRI와 정의.


1.4.2 적절한 용어의 사용.


RDF의 기계 중심 특성으로 인해 공급자는 소비 고객이 직접 진술 한 것 이외의 진술에서 어떤 의미를 추론하지 않거나 해당 진술에 포함 된 자원 및 용어에 대해 작성된 다른 진술로부터 논리적으로 추론 할 수있는 것을 가정해야합니다. 성명서. 예를 들어, 프로 바이더는 리소스 자체를 나타내는 이름으로 트리플의 리소스 이름을 사용할 수 있습니다. 그러나 트리플에서 술어로 사용 된 용어가 자원의 이름보다는 자원 자체를 참조하도록 설계된 경우, 클라이언트는 이름과 자원 자체 사이의 연결을 실패 할 수 있습니다. 용어가 정의 된 방법에 따라 클라이언트는 아래에 설명 된 것처럼 불일치를 감지하거나 의도하지 않은 결론을 이끌어 낼 수 있습니다. 텍스트 기반 데이터 전송 프로토콜과 달리 RDF는 클라이언트가 용어 정의에 포함 된 정보를 기반으로 추가 사실을 추론 할 수 있도록 설계되었으므로 의도하지 않은 결과를 초래할 수 있습니다. 예를 들어, 용어 foaf의 정의 : [FOAF]는 도메인을 foaf : Image로 선언하는 문을 포함합니다. 따라서 foaf : describes 속성을 사용하여 자원을 설명하는 제공자는 자원을 암시 적으로 (그리고 모르는 채로) 이미지로 선언합니다. 웹 온톨로지 언어 (OWL) [OWL]로 알려진 RDF 형식을 사용하여 정의 된 용어는 사용상 제약을받을 수있다. 예를 들어, 용어를 owl : ObjectProperty로 선언하면 속성의 값이 문자열 리터럴 (즉, 값은 IRI 여야 함)으로 일치하지 않음을 나타냅니다.


이러한 이유로 용어는 데이터 제공자가 용어를 정의하는 어휘 또는 온톨로지와 관련된 문서 및 사용 지침을 신중하게 검토 한 후에 만 ​​RDF의 술어로 사용해야하며 해당 용어의 사용이 해당 용어의 사용이 제공자는 용어가 술어로 사용되는 트리플에 부여하려고합니다.


범위, 도메인 및 하위 속성 선언이있는 용어를 RDF에 사용하는 경우의 의미에 대한 자세한 내용은 초보자 안내서의 RDF [RDF-BEGINNERS-GUIDE] 파트 4를 참조하십시오. RDF에서 용어의 복합 속성을 정의하는 데 OWL을 사용하는 방법에 대한 자세한 내용은 초보자 안내서의 RDF [RDF-BEGINNERS-GUIDE] 파트 7을 참조하십시오.


1.4.3 RDF에서 Darwin 핵심 용어 사용.


용어가 dwc : 네임 스페이스 (rs. tdwg. org/dwc/terms/)에있는 일반적인 Darwin Core 어휘는 주로 상대적으로 "평평한"데이터베이스 테이블에서 텍스트 기반 레코드를 쉽게 전송할 수 있도록 설계되었습니다. 이 때문에 일반적인 어휘와 관련된 권장 사항은 텍스트 문자열을 사용하여 물리적 개념적 개체, 즉 사람을 나타내는 이름, 기사를 나타 내기위한 인용 부호, 기관을 나타내는 코드 등을 나타낼 것을 제안합니다. 텍스트 문자열에 대해서는 1.5 절에서 자세히 설명합니다.) 레코드에 속성 값이 여러 개있는 경우 일반 Darwin Core 용어 정의에서는보다 정규화 된 데이터 구조를 만들지 않도록 여러 문자열을 단일 필드에 연결하고 윤곽을 지정할 것을 권장합니다 .


그러나 RDF에서 물리적 및 개념 적 개체의 식별은 일반적으로 리터럴이 아닌 IRI 참조에 의해 수행됩니다. 속성 값이 여러 개인 경우 각 값은 별도의 트리플에서 참조해야합니다. 따라서 우리는 특정 DwC 속성이 비 문자 (IRI 참조) 객체를 갖는 일대 다 트리플에 의해 표현되는 것이 바람직한 RDF의 상황에서, DWC 어휘집에있는 용어의 실제 정의는 이러한 속성은 하나의 리터럴 (텍스트 문자열) 객체가 제공되도록 지정합니다.


완벽한 세계에서 RDF를 제공하고자하는 모든 데이터 제공 업체는 물리적 자원 및 개념적 자원 (이름, 인용 부호, 코드 등)에 대한 문자 참조를 해당 자원을 식별하고 다른 구성원이 재사용하는 IRI GUID로 즉시 대체합니다. 그러나 적어도 처음에는 많은 공급자가 IRI 참조로 사용할 수있는 GUID가 거의 없다고 가정하기 때문에 IRI에서 독점적으로 참조되는 비 문자 (non-literal) 리소스를 요구하면 양식의 데이터 노출을 방해하게됩니다 RDF. 그러므로 공급자가 기존 (문자열) 데이터베이스 필드를 다음으로 변환 할 수없는 리터럴 객체에 대한 일반적인 DwC 용어를 계속 사용하면서 IRI 참조 객체를 사용하는 RDF에서 사용하기위한 DwC 용어의 대체 세트를 제공하는 것이 좋습니다. IRI 참조.


이 안내서는 리터럴이 아닌 객체와 함께 사용하기위한 용어 인 dwciri : (rs. tdwg. org/dwc/iri/) 네임 스페이스를 소개합니다. dwciri : 네임 스페이스의 용어가 동일한 로컬 이름을 갖는 dwc : 네임 스페이스에 아날로그를 갖는 경우 dwciri : 용어는 dwc : 대응어와 동일한 의미를 갖습니다. 예를 들어, dwciri : recordedBy는 dwc : recordedBy와 동일한 의미를 갖지만, RDF 술어 dwciri : recordedBy는 반복 가능하고 IRI 참조 객체를 갖습니다. 데이터베이스에 연결된 이름 목록을 포함하는 레코드가있는 dwc : recordedBy 필드를 포함하는 제공자는 dwc : recordedBy를 술어로 사용하고 연결된 목록 문자열 인 하나의 리터럴 객체를 포함하여 단일 RDF 트리플로 즉시 값을 게시 할 수 있습니다. 이러한 방식으로 모든 자원에 IRI GUID가 할당되어야한다는 요구 사항없이 RDF로 데이터를 게시하는 작업은 dwc : terms을 사용하여 즉시 시작할 수 있습니다. 커뮤니티가 IRI를 발견하고 재사용하기위한 메커니즘을 개발함에 따라 데이터 제공 업체는 dwciri : terms으로 전환 할 수 있습니다. 데이터 업데이트 및 정리 프로세스 공급자 또는 수집 자의 일부는 결국 문자열을 구문 분석하고 커뮤니티 IRI 리포지토리를 검색하며 문자열을 기존 IRI와 일치 시키거나 문자열이 존재하지 않는 경우 새로 만들 수 있습니다.


1.4.4이 가이드의 제한 사항.


이 안내서는 Darwin 핵심 속성 용어를 RDF 술어로 사용하는 방법에 대한 일반 지침을 제공하고 Darwin Core 클래스 용어를 rdf : type 선언 (2.3.1.5 절)에서 사용해야한다고 지정합니다. 그러나 Darwin Core 표준은 어떤 리소스가 해당 클래스의 인스턴스로 포함되어야하는지 또는 속성 용어로 도메인을 선언 할 것인지를 정확하게 지정하지 않습니다. Darwin Core 빠른 참조 가이드 [DWC-GUIDE]는 클래스 표제 아래에 해당 속성 용어를 구성하여 클래스의 인스턴스에 적용 할 수있는 속성을 제안하지만 Darwin Core는 형식 선언 및 속성 할당에 대한 특정 결정을 커뮤니티 합의에두고 있습니다. Darwin Core 클래스에 자원을 할당하고 Darwin Core 외부에 정의 된 객체 속성과 연결하는 다양한 접근법을 보여주는 몇 가지 예가 Darwin Core 정보 보조 웹 페이지 [DWC-RDF-ANCILLARY]에 제공됩니다.


1.5 dwc : namespace의 속성 값으로 텍스트 문자열의 역할.


인간이 서면 언어로 의사 소통 할 때, 그들은 의미를 부여하기 위해 일련의 텍스트 문자를 사용합니다. 경우에 따라 텍스트 문자열은 상대적으로 모호하지 않은 의미를 가질 수 있습니다. 그러나 많은 경우 텍스트 문자열의 정확한 의미는 텍스트 문자열이 사용 된 문맥에 따라 달라집니다. 예를 들어 텍스트 문자열 "독일"을 예로 들어 보겠습니다. 이 문자열은 동의 한 지리적 경계에 묶여있는 위치를 나타낼 수 있습니다. 이것은 정치 단체, 즉 "독일 정부"를 의미 할 수 있습니다. 특정 지리적 경계와 함께 거주하는 모든 거주자를 포함하는 실체를 지칭 할 수 있습니다. 특정 언어로 기록 된 이름을 의미 할 수도 있습니다. "독일"은 "독일"과 동일합니까? "독일"은 코드 "DE"와 동일한 의미입니까? "독일"은 "독일 연방 공화국"과 동일합니까? 이 질문들에 대한 답변은 "독일"이 의미하는 바에 달려 있습니다.


텍스트 기반 데이터 전송 시스템에서 텍스트 문자열은 정보가 전달되는 주요 수단입니다. 모든 문자열 값을 Darwin Core 속성 인 술어의 리터럴 개체로 만들어 기존의 Darwin Core 텍스트 기반 데이터를 RDF로 간단히 "번역"하는 것은 비교적 간단합니다. 그러나 그렇게되면 RDF가 부여하고자하는 "의미"를 전달하는 RDF가 나오지 않습니다.


텍스트 기반 시스템은 데이터 필드의 의미에 대한 미리 결정된 이해에 의존하기 때문에 사용자는 문자열 값의 역할을 신중하게 고려하지 않아도됩니다. 그러나 RDF에서는 문자열이 제공 될 때 클라이언트가 "내 뜻"을 알 것이라고 가정 할 수 없습니다. 따라서 dwc : 네임 스페이스에서 Darwin Core 속성에 문자열 값을 제공 할 때 의도하는 의미의 종류를 검토해 보는 것이 좋습니다.


1.5.1 문자열이 자원을 부호화하기위한 표준 수단 인 상황.


숫자, 날짜 및 제목은 본질적으로 개념적이지만 의미가 문자열로 오히려 완전하고 간결하게 전달 될 수있는 자료입니다. 문자열에 대해 데이터 유형 인코딩 스키마가 지정되거나 언어 속성이 제목의 언어를 나타내는 데 사용되는 경우 특히 그렇습니다. 이 경우 문자열 자체 이외의 리소스에 대한 추가 정보를 제공 할 필요가 거의 없습니다. 리터럴 객체로 충분합니다.


1.5.2 문자열 값이 비 정보 자원의 프록시 역할을하는 경우.


인간은 일반적으로 물리적 또는 개념적 (비 정보) 자원 인 자원을 표현하기 위해 이름 문자열을 사용합니다. 예를 들어 "Vincent van Gogh"라는 문자열은 Vincent van Gogh라는 이름을 가진 사람을 나타내는 데 사용됩니다. "Starry Night"가 "Vincent van Gogh"라는 별명으로 작성되었다고해서 "Starry Night"가 "Vincent van Gogh"라는 이름으로 만들어진 것이 아니라 "Starry Night"가 이름 빈센트 반 고흐 (Vincent van Gogh)였습니다. "별이 빛나는 밤 (Starry Night)"이란 그림의 이름입니다. 아마도 빈센트 반 고흐 (Vincent van Gogh)라는 사람이 그림의 이름보다는 그림을 만들었을 것입니다. 첫 번째 상황과는 달리, 이러한 이름 문자열 자체는 비 정보 자원 (예 : 생성 날짜, 특정 기간 동안의 위치 등)에 대해 알고 싶어 할 수있는 거의 모든 정보를 포함하지 않지만 자원에 대한 식별자로 사용할 수 있습니다. RDF에서 기계 가공 가능한 IRI는 문자열 식별자보다 리소스 식별자로 선호됩니다.


1.5.3 문자열 값이 검색을 가능하게하는 키워드 역할을하는 상황.


어떤 사람이 오크 나무를 "신 알바"라고 생각한다고 상상해보십시오. 해당 식별과 관련된 데이터는 dwc : scientificName = "Quercus alba"속성 / 값 쌍을 제공 할 수 있습니다. 이것은 그 나무가 Quercus alba라는 이름의 분류군의 대표자라고 주장했다는 것을 의미합니다. 식별과 관련된 데이터는 dwc : order = "Fagales"속성 / 값 쌍을 제공 할 수도 있습니다. 이것이 신분증을 주장한 사람이 나무가 Fagales 명령에 포함되었다고 주장한다는 것을 암시한다고 생각할 수도 있습니다. 그러나, 그 사람이 그런 주장을하지 않았고 사실 Fagales의 주문조차 들어 보지 못했을 가능성이 있습니다. 오히려 특정 분류학 계층 구조에 등록 된 데이터베이스 관리자는 dwc : scientificName 값이 "Quercus alba"인 모든 ID가 데이터베이스 사용자를 허용하기 위해 dwc : order = "Fagales"의 특성 / 값 쌍을 가져야한다고 주장했습니다 dwc : order 속성에 대한 공통 값을 공유 했으므로 관련된 식별자를 검색합니다.


요점은 실제 상황을보다 정확하게 묘사하기 위해서는 과학적 명칭 "Quercus alba"가 적용되는 분류군의 대표자로서 그 나무를 확인한 사람이 있다고 주장하는 정보, "Fagales"라는 이름이 적용되는 taxa와 higher taxa 사이의 관계를 주장하는 것이 있습니다.


1.5.4 문자열 값이 식별자로 사용되는 상황.


다수의 Darwin Core 속성은 값이 식별자 여야 함을 지정합니다. 상황에 따라 값은 주체 자원 자체의 식별자 일 수도 있고 주체 자원과 어떤 식 으로든 관계가있는 자원의 식별자 일 수도 있기 때문에 이러한 속성을 사용하는 데는 상당한 모호성이 있습니다. In addition, Darwin Core sometimes recommends (but does not require) a GUID as a value, but does not require that the GUID be either an HTTP IRI nor an IRI in general.


1.5.5 Implications for expressing Darwin Core string values as RDF.


To facilitate achieving the clarity that RDF makes possible, this guide provides different approaches for each of these four situations in which string values are provided. In the first three situations, the existing term from Darwin Core namespace dwc: can be used with a literal value to expose the string value as it currently exists in a text-based database. This allows for the rapid deployment of RDF described in Section 1.4.3 and is all that is required in the first situation (Section 1.5.1). In the second situation (Section 1.5.2), analogues of the existing dwc: terms have been created in the dwciri: namespace which are intended to be used with IRI-references rather than names. In the third situation (Section 1.5.3), new dwciri: terms have been created to relate subject resources to IRI-identified object resources which form part of a hierarchy. If such a hierarchy already exists, the need is eliminated for separate terms (“convenience terms”) which relate the subject resource to all parts of the hierarchy, although those terms can still be used if they are convenient for facilitating string searches. The last situation (Section 1.5.4) is more complex and a significant part of the implementation guide is devoted to the ways in which RDF should be structured to handle various kinds of identifiers.


2 Implementation Guide.


2.1 Definitions.


2.1.1 Namespace abbreviations used in XML qualified names (QNames) in this document.


For brevity, the examples do not include namespace declarations, nor an rdf:RDF container element. If a user wishes to test or validate an example, insert it into the container element defined in Section 2.1.2.


2.1.2 Generating graphical diagrams and triple tables for the examples.


The W3C RDF Validation Service [W3C-RDF-VALIDATOR] can be used to generate both a tabular listing and a graphical diagram of the triples that are included in the example XML serializations. Text from the examples can be placed inside the rdf:RDF container element below, then pasted into the validator box to generate the desired output.


2.1.3 Terminology.


"Resource" is a general term for any kind of entity that can be described using RDF. Resources can be physical, conceptual, or digital entities. Statements about resources are made in RDF in the form of "triples" [RDF-TRIPLES]. A triple consists of a subject, a predicate, and an object:


In the second row of Table 2, the full IRIs are given. In the third row namespace abbreviations are used to shorten the IRIs. The following fragments of RDF shows the triple in RDF/XML and Turtle serializations of the triple shown in Table 2:


The Dublin Core Metadata Initiative (DCMI) Abstract Model [DCAM], which was designed to be compatible with RDF, describes subject resources using property-value pairs, which correspond to pairs of predicates and objects. When referring to Dublin Core terms (as well as Darwin Core, which is modeled on Dublin Core) "property" is used synonymously with "predicate" and "value" is used synonymously with "object". In Example 1, foaf:maker is a property and viaf:9854560 is the value associated with that property. Predicates must be identified by IRIs. Objects of triples may be identified in three ways: 1) the object resource can be identified by an IRI reference, 2) the object can be identified by a non-IRI string, in which case it is called a literal, and 3) the object resource can also be left unidentified, in which case it is called a blank node or an anonymous node. Blank nodes are undesirable if it is important that other data providers be able to refer to the resource they represent. However, blank nodes may be preferable if external references to the resource are not relevant, or if the data provider is unable or unwilling to provide a stable IRI to identify the resource. IRI references and blank nodes can be the subjects of RDF triples, but literals cannot.


2.2 Subject resources.


If the subject of an RDF triple is identified (i. e., not an anonymous node), it must be referenced by an IRI. This section describes how IRI identifiers are referenced in RDF and how non-IRI identifiers should be associated with the subject of the triple.


2.2.1 Identifying subject resources using IRIs.


The rdf:about attribute of the rdf:Description element is used in RDF/XML to identify the subject of a triple:


2.2.2 Associating a string identifier with a subject resource.


The Dublin Core term dcterms:identifier should be used to associate a string literal identifier (e. g., UUID, "Darwin Core Triplet", or ARK) with an IRI-identified resource as shown here in RDF/XML:


If an HTTP IRI is considered to be the identifier for a subject resource, it is acceptable to present it as a string literal value for dcterms:identifier in addition to using it in the rdf:about attribute of the subject resource, as in Example 2:


2.2.3 Associating a URN with its HTTP-proxied equivalent.


The TDWG LSID Applicability Statement standard [GUID-STANDARD] specifies in Recommendation 30 that "The description of all objects identified by an LSID must contain an owl:sameAs , owl:equivalentProperty or owl:equivalentClass statement expressing the equivalence between the object identifier in its standard form and its proxy version". This is illustrated by Example 3:


Since LSIDs follow the URN IRI scheme, they can serve as the subject of any RDF triple. However, it is better to use the http-proxied form as the subject (i. e., the value of the rdf:about attribute) in the description of the resource. See the Darwin Core informative ancillary web pages [DWC-RDF-ANCILLARY] for more information about implementing LSIDs.


This practice can be extended to any URN. For example, owl:sameAs can be used to relate the URN <urn:uuid:f81d4fae-7dec-11d0-a765-00a0c91e6bf6> to its HTTP-proxied equivalent <provider. org/f81d4fae-7dec-11d0-a765-00a0c91e6bf6> in a manner analogous to Example 3.


2.3 Predicates.


Most terms in the Darwin Core vocabulary can be used as predicates in triples to represent properties of subject resources. The full term IRI must be used, although with an appropriate namespace declaration, the namespace can be abbreviated (Section 2.1.1). RDF does not restrict the source of predicates, therefore Darwin Core terms can be mixed with terms from other vocabularies. This includes the important predicate rdf:type which is used to indicate the class of which the subject resource is an instance. There is no prohibition in RDF against repeating properties.


2.3.1 Declaring the type of the resource.


In RDF, a resource may be characterized by declaring that it is an instance of a class. Indicating that a resource is an instance of a class provides several benefits. It allows a consumer to narrow the results of a search by limiting the search to certain types of resources. It suggests to data providers what sorts of properties should be used to describe a resource. It allows consumers to anticipate what sorts of properties they might expect to be provided for that resource and allows developers to build applications that exploit those expectations. Because of these benefits, RDF provides several built-in mechanisms for asserting class membership, most notably the rdf:type property [RDF-TYPE] which is used to state that a resource is an instance of a class. There is nothing that prohibits assigning more than one rdf:type property to a resource. In fact, there may be a benefit in describing a resource as a member of both a class which has specific meaning within a narrow community and a more well-known class which has a broader meaning and is therefore more likely to be understood by generic clients. For instance, a resource may be typed as both a dwc:PreservedSpecimen and a dcmitype:PhysicalObject .


2.3.1.1 rdf:type statement.


The predicate rdf:type is defined to have an object that is a class. The class should be identified by an IRI reference (not by a literal) as in Example 4:


In Turtle serialization, rdf:type can be abbreviated as " a " (Example 4). In XML serialization, the RDF specification provides an abbreviated way to specify the type of a described resource. This method is called a typed node element [TYPED-NODE]. The rdf:Description element is replaced by an element whose name is an XML qualified name that identifies a class of which the described resource is an instance as in Example 5:


This example serializes the exact same two triples as Example 4. The rdf:type triple is implied by the container element name.


2.3.1.2 rdf:type assertion through domain and range declarations.


The RDF Schema (RDFS) specification [RDFS] defines two terms that assert rdf:type implicitly when certain predicates are used. When a predicate P having the property.


is used to describe a subject resource, a client can infer that the subject resource is an instance of class C . For example, the term dcterms:bibliographicCitation is assigned the property.


in its definition. If that term were used as the property of a specimen, a client could infer that the specimen had rdf:type dcterms:BibliographicResource :


When a predicate P having the property.


is used with a value, a client can infer that the value is an instance of class C . The term dcterms:language is assigned the property.


in its definition. If the object of that term in an RDF triple is a reference to the IRI for English assigned by the MARC ISO 639-2 Codes for the Representation of Names of Languages [MARC-LANGUAGES] (Example 7), then it can be inferred that id. loc. gov/vocabulary/iso639-2/eng is a dcterms:LingisticSystem even though the MARC description in RDF does not assert that directly in its definition.


No terms defined within the Darwin Core namespace have range or domain declarations. However, some terms imported into Darwin Core from Dublin Core do have domain or range declarations. Sections 3.2 and 3.3 of this guide gives the declared ranges and domains when they are asserted for such terms.


2.3.1.3 Explicit vs. inferred type declarations.


Because the use of a predicate having a range or domain declaration implies the rdf:type of a resource, data providers should exercise caution in using any such term in a non-standard way. For example, if the property foaf:familyName were used with a specimen (e. g., to indicate the taxonomic family), that use would imply that the specimen was a foaf:Person . However, it cannot be assumed that all clients will perform the reasoning necessary to infer the rdf:type declarations implied by range and domain declarations. Therefore, if a data provider feels that it is important for a consumer to know that a resource is an instance of a particular class, the provider should type the resource using an explicit rdf:type triple even if that asserts the same information that could be inferred from a domain or range declaration. For example, if providers of images want to assure that an image will be found in a query for resources having rdf:type foaf:Image , they should not assume that describing the image using the property foaf:depicts will accomplish that because of the range declaration of foaf:depicts . It would be safer to include.


in the description of the image. In fact, the provider would probably also want to include.


in the description so that clients searching for instances of either foaf:Image or dcmitype:StillImage class resources would find the image.


2.3.1.4 Other predicates used to indicate type.


Both the Dublin Core and Darwin Core define terms that can be used to describe the nature of a resource: dcterms:type and dwc:basisOfRecord respectively. However, using these terms to describe the nature of the subject resource is not a substitute for use of rdf:type . The DCMI notes on RDF semantics [DC-RDF-SEMANTICS] recommend that "applications implementing this specification primarily use and understand rdf:type in place of dcterms:type when expressing Dublin Core metadata in RDF, as most RDF processors come with built-in knowledge of rdf:type ." A similar argument could be made for the use of rdf:type over dwc:basisOfRecord . Including dc:type , dcterms:type , and dwc:basisOfRecord in an RDF description should be considered optional, while including rdf:type should be considered highly recommended. A dwciri: analogue (Section 2.5) of dwc:basisOfRecord should not be used. Use rdf:type instead when the object is an IRI reference. Here is an example that describes a specimen using several of the terms that define the nature of a resource explicitly, including multiple rdf:type declarations:


Refer to Sections 2.4.3 and 2.5 for an explanation of the distinction between terms in the dc: , dcterms: , dwc: , and dwciri: namespaces.


2.3.1.5 Classes to be used for type declarations of resources described using Darwin Core.


The TDWG GUID Applicability Statement standard [GUID-STANDARD] specifies that an object in the biodiversity domain that is identified by a GUID should be typed using a well-known vocabulary. With this recommendation in mind, it should be considered a best practice to provide information about the type (i. e., class membership) of any resource that is assigned a persistent identifier in the form of an IRI. Since Darwin Core is a well-known vocabulary and a ratified TDWG standard, its classes should be used for typing in preference to classes in parts of the TDWG ontology which are not ratified standards and are effectively deprecated. The human-readable definitions of the Darwin core classes provide guidance for deciding the types to assign to resources, although community consensus may be necessary to classify some of the more complex kinds of resources. (Section 1.4.4)


Any Darwin Core class IRI may be used as a value for rdf:type , although it is not clear whether dwc:ResourceRelationship instances make sense in the context of RDF. The following list summarizes classes included in the Dublin Core type vocabulary (but which are not part of Darwin Core) that should also be used for typing biodiversity-related resources:


dcmitype:StillImage dcmitype:MovingImage dcmitype:Sound dcmitype:PhysicalObject.


2.4 Object resources.


Section 1.3.1 of the Introduction to this guide shows how the object of an RDF triple can be a expressed as either a string literal or an IRI reference. It is also possible to have non-literal objects that are not identified by an IRI. These are known as blank or anonymous nodes. This section describes how to express objects in each of these three forms. Section 1.4.3 and Section 1.5 of the Introduction explains the issues involved in exposing data for which values as string literals (e. g., names, citations, and codes) are used as proxies for non-literal resources. This section also discusses strategies for expressing such data as RDF.


2.4.1 Literal object resources.


Some resources such as titles, dates, and numbers can be intrinsically expressed as strings. In cases where it is appropriate for the object of a triple to be a string, in RDF/XML the string is placed in a container element whose qualified name is the property:


2.4.1.1 Typed literals.


Because literals cannot be the subjects of RDF triples, it is not possible to describe the properties of literals extensively in RDF. However, specifying a datatype IRI for a literal provides a mechanism that allows an client to interpret the nature of the resource that the string denotes. [RDF-DATATYPE-SEMANTICS] [RDF-DATATYPE-SYNTAX]


The rdf datatype attribute indicates that the string conforms to a particular format (integer, date, etc.) that maps the string to its abstract value.


If the string expresses information in a particular language, a provider should include an xml:lang attribute [XML-LANG] to indicate the language of the string through the RFC 4646 language code [LANG-CODES] for that language. In addition to specifying the language of the string, providing a language tag entails that the described resource has the type rdf:langString .


In the RDF 1.1 specification, datatype D-entailment is a direct extension to basic RDF. [RDF-DATATYPE-SEMANTICS] The specification establishes that literals without explicit datatype attributes or language tags have an implicit datatype xsd:string . That also entails that the rdf:type of those literals is xsd:string [RDF-ENTAILMENT-RULES]. The practical implication of this is that literals that are exposed without datatype attributes or language tags should be interpreted by clients to be a sequence of characters, and not some other abstract or non-information resource that a human might interpret the sequence of characters to represent. This has practical implications in Section 2.4.3 (where untyped literals are value strings intended to represent non-literal resources) and Section 2.7 (where untyped literals provide a convenient means for facilitating string-based searches). Although it is likely that many providers may initially choose to expose literals without datatype attributes, they should move towards replacing them with URIs or datatyped literals that accurately represent the type and properties of the resource that the untyped literals are intended to represent.


Section 3.4 indicates which Darwin Core terms would be appropriately used with values having datatype or language attributes.


2.4.1.2 Terms intended for use with literal objects.


The definitions of some terms make it clear that they should be used with literal objects. Darwin Core specifically "imports" several Dublin Core terms [DC-TERMS] into its vocabulary for use in describing biodiversity data. In some cases, terms in the dcterms: namespace have range declarations of rdfs:Literal and are therefore understood to be intended for use with literal objects (strings). In some vocabularies, certain terms are required to have literal objects because in their definitions they are declared to be owl:Datatype properties. In the case of Darwin Core terms in the dwc: ( rs. tdwg. org/dwc/terms/ ) namespace, the normative term definitions in RDF do not include any declarations that indicate whether the terms should be used with literal or IRI reference objects. (Exceptions to this are the various date-related terms, which inherit the range rdfs:Literal because they are rdfs:subPropertyOf dcterms:date .) However, because the dwc: terms were originally designed to accommodate text and XML data transfer, their definitions generally specify how term values should be expressed as string literals. This guide establishes the convention that terms in the dwc: namespace should be restricted to use with literal objects so that their use in RDF will be consistent with their definitions. As discussed in Section 1.4.3 and Section 2.5, this guide introduces a separate namespace rs. tdwg. org/dwc/iri/ (abbreviated as dwciri: ) for additional Darwin Core terms which are intended to have objects that are IRI references.


2.4.2 Non-literal object resources.


Resources that are physical or conceptual often cannot be intrinsically represented as string literals and if identified, they are referenced in RDF by IRIs. Digital resources (e. g., images, web pages, etc.) could be represented as literals (the encoded content of the resource), but because many characters would be required to do that, they are usually referenced as independent entities through IRIs. In RDF/XML an IRI reference to a non-literal object can be made using the attribute rdf:resource in an empty XML element:


A description of the referenced non-literal object may be found within the same document, among data from another provider, or there may be no description of the object. If the RDF document will describe further properties of the non-literal, IRI-identified resource, those properties can be placed within an rdf:Description container element having an rdf:about attribute whose value is the IRI of the resource:


If the non-literal object is not identified by an IRI (i. e., it is a blank node), its properties can be placed within an rdf:Description container element that has no rdf:about attribute and which is itself within a container element for the property:


2.4.2.1 When should non-literal object resources be described within the same document?


There are positive and negative aspects to describing a resource within the same document that references it. If the IRI is not dereferenceable, either because the IRI is not a type that can be dereferenced by HTTP (e. g., a URN) or because the issuer of the IRI is temporarily or permanently failing to respond to HTTP calls, then providing minimal information about the resource in the referencing document may be beneficial. For example, if a property referred to a printed book which had an ISBN but no HTTP IRI, as in:


a description providing basic publication data such as:


could be included as part of the document that references the ISBN in URN form. The RDF shown in Examples 13 and 14 could be represented in Turtle as:


However, if the IRI references an object resource whose data are being actively managed by another provider, then any data which are included in the referencing document may become outdated. In that case, it is probably better to simply link the IRI, and let the consumer of the referring document dereference the IRI to retrieve the most up-to-date data about the object resource. In this example:


the rights holder object IRI is managed by an institution other than the image owner. That institution might update the data associated with the IRI at any time. So it would probably be best to simply let consumers retrieve data about the rights holder through dereferencing the IRI.


2.4.2.1.1 Objects identified by LSIDs.


In the previous example, the HTTP IRI used as the object of the dcterms:rightsHolder property was an HTTP-proxied form of an LSID. Because an LSID is a URN and therefore a type of IRI, the RDF specification does not prohibit the use of an LSID as an IRI referenced object. However, the TDWG LSID Applicability Guide standard dictates that LSIDs must not be used as the object of RDF triples (Recommendation 31 of [GUID-STANDARD]) because a client would not necessarily be able to dereference the LSID to discover additional information about the object resource. The HTTP-proxied version of the LSID should be used instead (see Section 2.2.3). See the Darwin Core informative ancillary web pages [DWC-RDF-ANCILLARY] for more information about using LSIDs in RDF.


2.4.2.2 Objects which are blank (anonymous) nodes.


Under most circumstances, it is desirable to refer to a non-literal object resource by an IRI because omitting an IRI reference makes it impossible to associate an external reference with the object resource. In the following example:


the described subject resource refers to an object resource that is not identified with an IRI, that is, an object resource represented by a blank node. From the properties of the unidentified resource we know that the object resource is a foaf:Document from 2003 entitled "Collection notes" and created by Joe Curator. By using a blank node to represent the resource, the properties of that resource can be described and collectively associated with the dcterms:references property without requiring the data provider to mint an IRI for that resource. The data provider may feel that there is no need for another provider to refer to that resource, or the provider may be unwilling or unable to maintain a separate identifier for the resource. For example, in Example 12, the data provider may not have had access to an IRI identifier for the Trustees of the University of Lavonia and might not be interested in taking on the job of assigning one. At some future point, the provider could replace the blank node with an IRI reference if an IRI for the Trustees of the University of Lavonia were discovered.


2.4.3 Object resources that have been previously represented by literals but which are actually non-literal resources.


In databases the names of entities have frequently been used to represent the entities themselves. For example, the name of a person is often used as a proxy for the person, or an abbreviation for a language has been used to represent the language itself. Prior to the creation of the DCMI Abstract Model, many data which were described using terms in the legacy Dublin Core namespace dc: ( purl. org/dc/elements/1.1/ ) followed the historical practice of using the name of an entity to represent a non-literal entity. Extending this practice to RDF would result in representations such as this:


However, over time, the community of RDF users has come to consider it a best practice to distinguish between a string (such as a name) and the thing that the string represents [USING-DC-CREATOR]. To make the distinction between strings and the resources they represent, there has been an effort to clarify whether particular terms should be used with literal objects, or with IRI reference objects.


2.4.3.1 Literal values for non-literal resources in Dublin Core.


The introduction of the DCMI Abstract Model (DCAM) and subsequent guidelines for the use of Dublin Core terms in RDF [DC-RDF] were intended to clarify the use of Dublin Core terms with literal and non-literal objects [DC-RDF-NOTES]. In particular, ranges were declared for terms in the dcterms: namespace ( purl. org/dc/terms/ ) with the intention of clarifying whether each term was intended for use with a literal or a non-literal value. For example, dcterms:bibliographicCitation has the range rdfs:Literal , while dcterms:creator has range dcterms:Agent . Because the term dcterms:creator has a non-literal range, it should be used with an object that is an IRI reference as illustrated in the following example:


The Dublin Core RDF guidelines [DC-RDF] provided a mechanism using the term rdf:value to permit legacy string literal data to be associated with Dublin Core terms in the dcterms: namespace that were not intended for use with literal objects. Using this mechanism, a non-literal resource could be represented by a blank node having an rdf:value property whose value was the legacy string literal. This value is known as a “value string”. However, the mechanism which involves using rdf:value as a predicate has not been widely implemented. At the time when the dcterms: terms were defined, terms in the dc: namespace were left without range declarations. Thus it has been considered acceptable to use the dc: namespace terms with legacy string literals (i. e., value strings) as shown in Example 15 [DC-LINKED-DATA]. Many providers of non-RDF data may have used literal values for terms in the dcterms: namespace that have non-literal ranges. Note that all terms in the dcterms: namespace that have corresponding terms in the dc: namespace (i. e., terms with identical local names sensu [RDF-VOCAB-PUB]) are declared to be rdfs:subPropertyOf those dc: namespace terms [DC-SUBPROPERTIES]. So if a data provider's non-RDF database contains string values for terms in the dcterms: namespace having non-literal ranges, it is appropriate to expose those literals in RDF as values of corresponding dc: terms.


2.4.3.2 Literal values for non-literal resources in Darwin Core.


Because there are many legacy data composed of string values of dwc: namespace ( rs. tdwg. org/dwc/terms/ ) terms whose objects actually represent non-literal entities (i. e., value strings sensu DCAM), it is likely that many providers will at least initially expose such data in RDF as string literals served directly from their existing databases [RDB2RDF]. To make it possible for the legacy data to be exposed as RDF while also ensuring that the meaning of those data is preserved, in RDF the literal value of an existing Darwin Core term in the dwc: namespace should have the same structure as that described in the term's description, as in Example 19.


The terms in the dwc: namespace should NOT be used for IRI reference objects, even if the term definition suggests that the object resource is of a non-literal type. Instead, IRI reference objects should be used with terms in the dwciri: namespace as defined by this guide in Section 2.5. When a string value is provided as the object of a dwc: namespace term whose definition suggests that the object is of a non-literal type, that string is understood to be serving as a value string.


2.5 Terms in the dwciri: namespace.


Terms in the namespace dwciri: ( rs. tdwg. org/dwc/iri/ ) are intended for use with IRI reference objects and should NOT be used with literal objects. They may also be used with blank node objects, although in most cases this will probably be unnecessary.


2.5.1 Definition of dwciri: terms.


If a term in the dwciri: namespace has a corresponding term with the same local name [RDF-VOCAB-PUB] in the dwc: namespace, the dwciri: namespace term is defined to have the same meaning as its dwc: namespace term analogue. In defining a dwciri: term that has a dwc: analogue, the definition of the dwc: term is understood to be modified in the following ways:


when a dwciri: term is used as an RDF predicate, its non-literal object will be identified by an IRI reference rather than a string literal the object of the dwciri: term predicate will be a single resource. If the dwc: term definition specifies that multiple values should be a concatenated list, the resource described by a dwciri: property should be the subject of a triple for each value on the list. Alternatively, a single triple can be used to describe the subject if the object is a single resource composed of component resources described using additional RDF triples.


Several terms in the dwciri: namespace do not have dwc: namespace analogues ( dwciri:inCollection , dwciri:toTaxon , dwciri:inDescribedPlace , dwciri:earliestGeochronologicalEra , dwciri:latestGeochronologicalEra , dwciri:fromLithostratigraphicUnit , and dwciri:inDataset ). Their definitions are given in the normative RDF for dwciri: properties and are described in Section 3.6.


2.5.2 Using terms in the Darwin Core dwciri: namespace with non-literal objects identified by IRI references.


The following example shows how the data from Example 19 could be expressed if IRIs were available to identify the persons whose names composed the literal:


where <viaf. org/viaf/263074474> is a persistent IRI identifier for the person whose name is "Oliver P. Pearson" and <museum-x. org/personnel/akp> is a persistent IRI identifier for the person whose name is "Anita K. Pearson".


2.5.3 Expectation of clients encountering RDF containing dwc: and dwciri: terms.


A client that encounters a triple having a term from the dwciri: namespace as its predicate can expect the object of the triple to be an IRI reference and subsequently may be able to dereference that IRI to obtain additional information about the entity that it represents. A client encountering a triple having a term from the dwc: namespace should be prepared to accept a literal object, although it is possible that some data providers unaware of this guide may have used dwc: terms with IRI references as rdf:resource attributes. Application developers should be flexible in their expectations for the values of properties from the dwc: namespace.


2.6 Darwin Core ID terms and RDF.


Darwin Core contains a number of "ID" terms intended to designate identifiers, e. g., dwc:occurrenceID , dwc:identificationID , dwc:locationID , etc. The "ID" terms provide two functions, specifying the class of the resource and indicating that value of the term is an identifier. These functions are illustrated by the non-RDF XML below, which is part of an example provided in the Darwin Core XML Guide [DWC-XML]:


This example could also be represented by the following database table in which each record (row) represents an dwc:Identification instance and in which each column represents a property of the dwc:Identification instance as indicated by the column heading:


In Example 21 and Table 3, the "ID" terms are used to specify both the identifier of a resource which is the subject of the record itself (using the term dwc:identificationID ) and to specify an object resource related to the subject resource by a foreign key (using the term dwc:taxonID ). Because the ID terms are not designated to be used with subjects or objects specifically, the resource they identify must be made clear by the context in which they are used. In the case of the database table, a pre-existing understanding between the data provider and consumer would indicate that the rows of the table represent dwc:Identification instances and therefore the dwc:identificationID property would provide the identifier of the subject and any other ID terms would refer to object resources that are related to that particular identification instance. In the XML example, the type of the subject resource is made clear through the record's container element and hence a consumer would know that the dwc:identificationID property referred to the subject resource. In RDF, the two functions (specifying type and referencing an identifier) are handled separately using rdf:type declarations (Section 2.3.1) and defined mechanisms for expressing the identifier of the subject resource (Section 2.2). Because these mechanisms are well-known best practices outside TDWG, they should be used rather than using the Darwin Core ID terms when data are expressed as RDF. The following example shows an appropriate way to express the information in Example 21 as RDF:


The following points about the Example 22 should be noted:


1. In RDF/XML use the rdf:about attribute of an rdf:Description element to specify an IRI identifier used with the subject ID term, i. e., the value of dwc:identificationID is an HTTP IRI and can therefore be used with the rdf:about attribute. The dcterms:identifier property can also be used to express the primary identifier for the subject resource as a literal. In Example 22, the HTTP IRI is considered the primary identifier for the Identification instance so it is included as a string value of dcterms:identifier as well as the IRI of the subject resource. Refer to Section 2.2.1 and 2.2.2 for more details.


2. Data providers who want to relate a subject resource to related non-literal resources should use object properties (i. e., properties which relate IRI-identified instances to other IRI-identified instances) [OWL-PRIMER] from a well-known vocabulary or ontology. Darwin Core does not generally define object properties that connect its core classes and in those cases users will have to find object properties outside of Darwin Core (see the Darwin Core informative ancillary web pages [DWC-RDF-ANCILLARY] for examples). In this example, the term dwciri:toTaxon (see Section 2.7.4) is used to relate the dwc:Identification instance to a taxon instance. (Please note that this is for illustration purposes only and this guide takes no position on the nature of taxa or taxon concepts or whether the resource used in this example is actually a taxon or not.)


3. If an identified object of a triple is a non-literal resource (Section 2.4.2), RDF requires that it be referenced by an IRI. Although the UUID "d79c11aa-29c1-102b-9a4a-00304854f820:col20120721" is a globally unique and hopefully persistent identifier for the taxon, it is not an IRI. Catalog of Life has created an IRI from the UUID in the form of an LSID:


so expressing the object reference as.


would be valid RDF. However, best practices (Section 2.4.2.1.1) specify that when LSIDs are the objects of triples, they should be in HTTP-proxied form. In Example 22, the LSID is proxied using the TDWG LSID resolver.


4. The class of the subject identification instance ( dwc:Identification ) is asserted explicitly using rdf:type . The type of the object taxon instance is not stated directly - a client would need to dereference the IRI to discover it.


2.6.1 Unintended consequences of using Darwin Core ID terms in RDF.


The previous section showed that using a Darwin Core ID term to indicate the identifier associated with the subject resource is not necessary because there are well-known means in RDF (the rdf:about attribute and the dcterms:identifier property) for exposing the subject’s identifier. However, as shown below, using a Darwin Core ID term to identify an object resource (as shown in the non-RDF XML Example 21) would actually be problematic. In its normative definition, each Darwin Core ID term is declared to be rdfs:subPropertyOf dcterms:identifier . In RDF, the purpose of a subproperty declaration is to allow a client with reasoning capability to infer a triple containing a broader (and presumably more well-known) property. In the terminology of Dublin Core, the "ID" term is a qualifier which "refines" a basic Dublin Core term [DC-QUALIFIER] and the process of inferring a broader meaning from a more specific term is called a "dumb-down" operation. If a provider attempting to expose the data of Table 3 as RDF used the dwc:taxonID term as a property of the identification as shown in the (incorrect) Example 23:


RDF/XML (incorrect usage)


Turtle (incorrect usage)


there would be an undesired effect if a client unfamiliar with Darwin Core performed a "dumb-down" operation (i. e., fell back to the broader meaning of the dwc:taxonID term as dcterms:identifier ). The client would infer the triple:


where the value of the dwc:taxonID term was the identifier of the subject resource rather than of the object resource as intended by the data provider. This is why data providers will generally need to look outside Darwin Core for object properties that can be used to relate instances of one class to instances of another instead of using the Darwin Core ID terms.


2.7 Darwin Core convenience terms.


In several situations, providers of Darwin Core text-based data use a set of hierarchical property/value pairs to unambiguously specify a resource. For example, a database record for a resource collected at N 36.4024°, W 87.02219° might contain the following data:


The data unambiguously specifies the lowest level political subdivision (Robertson County) by including the higher level political subdivisions in the hierarchy and thus differentiates it from other places that are second-order administrative divisions identified by the string “Robertson” (e. g., Robertson County, Texas, US or Robertson County, Kentucky, US). Darwin Core terms that are used to form a hierarchy of literal values are called convenience terms.


2.7.1 What purpose do convenience terms serve?


When expressing the data about resources collected in Robertson County in RDF, it really isn’t necessary to indicate in every record that North America is a parent feature of the United States, that the United States is a parent feature of Tennessee, and that Tennessee is a parent feature of Robertson County. It is only necessary to link the record to an IRI for Robertson County such as <sws. geonames. org/4653638/> and a semantic client can discover the parent features by traversing the gn:parentFeature property of features included in the hierarchy. Once a client has discovered the higher level parts of the hierarchy in which it is interested, no additional retrieval of data about the hierarchy is required.


In general, it should not be necessary for a data provider to recreate hierarchical RDF relationships that have already been expressed by a centralized service. For that reason, this guide does not describe best-practices for expressing such relationships in RDF. Nevertheless, there are several reasons why it may be convenient for a data provider to expose literal values from existing text-based data:


the provider may be unable or unwilling to discover and link to an IRI for the lowest level of the hierarchy, yet wish to facilitate future discovery of such IRIs through string matching by applications or aggregators. the provider may want to facilitate simple string-based queries (e. g., [SPARQL]) at any level of the hierarchy. the provider may wish to make it easier for consuming applications to create human-friendly representations of the data in which presenting the string hierarchy would be meaningful.


2.7.2 Literal convenience terms versus a single object property reference.


There are several groups of convenience terms in the dwc: namespace which may be used to provide literal values for the purposes listed above (Section 3.6). In the case of each of these groups, it is not expected that a provider will link to IRI references for each level in the hierarchy. Therefore, dwciri: analogues are not defined for those convenience terms from the dwc: namespace. Rather, for each category of convenience terms, there is a single dwciri: namespace term (having no analogue in the dwc: namespace; Section 3.7) that can be used to link to the lowest available level in the hierarchy with the understanding that the RDF of the object resource will provide links to other IRIs for higher levels of the hierarchy. Such dwciri: terms can refer to any level in the hierarchy if there is uncertainty about the identity of lower levels, or if lower levels do not exist.


2.7.3 Ownership of a collection item.


Historically, the set of values for dwc:institutionCode , dwc:collectionCode , and dwc:catalogNumber (a “Darwin Core triplet”) has been used to identify a collection item and to indicate the owning institution and collection within that institution as shown in Table 7.


In RDF, unique identification of collection items is done through the IRI which acts as a globally unique identifier for that item. The Darwin Core triplet properties may still be provided as literal values, but ownership/control of the collection item should be indicated using dwciri:inCollection with an HTTP IRI as the IRI-reference object. For physical specimens, the recommended best practice is to use a collection IRI from a collections registry such as an HTTP-proxied LSID from the Global Registry of Biorepositories [GRBIO]. Example 24 illustrates this for the data from Table 7.


2.7.4 Description of a taxonomic entity.


The consensus embodied in the TDWG Taxon Concept Transfer Schema (TCS) standard [TCS-STANDARD] is that identification instances refer to taxon concept instances. Therefore it would be a best practice to describe taxonomic entities in RDF as taxon concepts sensu TCS. However, because the TCS standard is an XML schema, it is not directly translatable to RDF. It is considered to be out of the scope of this document to specify how taxon concepts should be rendered as RDF. Nevertheless, Darwin Core does define many convenience terms listed under the dwc:Taxon class that can be used as properties of dwc:Identification instances (Section 3.5).


It might be argued that these convenience terms would more appropriately be properties of a dwc:Taxon instance. However, the object properties necessary to relate dwc:Taxon instances to name entities, references, parent taxa, and child taxa do not exist and the exact relationship between taxonomic entities such as taxon concepts, protonyms, taxon name uses, etc. has not been established using RDF. So the creation of functional dwc:Taxon instances described using RDF is not possible at the present time. Therefore this document establishes the convention that convenience terms for taxonomic entities should be properties of dwc:Identification . The task of describing taxonomic entities using RDF must be an effort outside of Darwin Core. This guide does establish the object property dwciri:toTaxon for use in relating a Darwin Core identification instance to a taxonomic entity as defined elsewhere.


Consider the following example where Takuma Yun identified a spider to the species Hersilia yaeyamaensis using information in Tanikawa (1999). The data about this identification was listed in a database as shown in Table 8.


In this example, a best practice would be to link the identification instance to a taxon instance of Hersilia yaeyamaensis sec. Tanikawa 1999 using the object property dwciri:toTaxon as shown in Example 22. However, the data provider may be uninterested, or unable to mint or discover a taxon instance to which the identification instance can be linked. The provider may simply wish to make it easier to discover the identification instance and be unconcerned about the taxonomic relationships that might be asserted for concepts that may be defined for the listed name components. In that case the provider can use the following RDF:


In the example, providing the triple.


should not be taken to imply that Takuma Yun asserted that the spider he identified was classified within the order Araneae, nor should the RDF be assumed to imply that Takuma Yun asserted that Aranaeae is the name of a parent taxon of the genus Hersilia . Those sorts of assertions would need to be made using more complex RDF and a more expressive vocabulary outside of Darwin Core. The RDF simply makes it easier for users who are looking for spider identifications to search for them by looking for identifications having dwc:order of “Araneae”, dcw:genus of “Hersilia”, and a specific epithet of “yaeyamaensis”. If it can be determined (perhaps at a later time) that the taxon described by the convenience terms corresponds to a particular IRI-identified instance, the identification instance can be linked to it using an object property, e. g.,


2.7.5 Names of geographic subdivisions.


The data from Table 5 can be expressed as shown in Example 26. In the example, the term dwciri:inDescribedPlace is used as an object property to link the dcterms:Location instance to an IRI for the lowest known geographic subdivision which applies to the locality. dwc:locality could also be used to provide a string literal description of the specific description of the place.


Because generic RDF places no restrictions on repeating properties, a dcterms:Location instance could have multiple dwciri:inDescribedPlace properties if the location is included within several described geographic subdivisions. For example, a particular location could be included within <sws. geonames. org/4626068/> (The Great Smoky Mountains National Park which straddles two states) and <sws. geonames. org/4656568/> (Sevier County, Tennessee, US, which is the lowest level political subdivision).


2.7.6 Chronostratographic (geological timescale) descriptors.


The following example is taken from dx. doi. org/10.1098/rsbl.2011.0228, which involves the geological context of a fossil serving as a holotype for a species description. In this example (Table 9), there is a single value given for the Epoch (Middle Jurassic), so the values for each of the earliest. /latest. stratigraphic timescale term pairs are the same.


Example 27 shows how this can be rendered as RDF using the Darwin Core stratigraphic timescale terms as convenience terms.


In this example, the object properties dwciri:earliestGeochronologicalEra and dwciri:latestGeochronologicalEra link to an IRI that identifies an instance of the gsml:GeochronologicEra class which uses SKOS to relate the Middle Jurassic epoch to higher levels in the geochronological hierarchy.


2.7.7 Lithostratigraphy descriptors.


Since lithostratigraphic units are hierarchical, the pattern followed with the other hierarchical convenience terms applies to the Darwin Core lithostratigraphic terms categorized under the dwc:GeologicalContext class ( dwc:group , dwc:formation , dwc:member , and dwc:bed ). The object property dwciri:fromLithostratigraphicUnit can be used to link the IRI for a lithostratigraphic unit at the lowest appropriate level.


2.8 Darwin Core association terms.


Darwin Core contains a number of terms whose local name begins with "associated" ( dwc:associatedMedia , dwc:associatedOccurrences , etc.), which are referred to as "association terms" in this guide. Because these terms were designed to link the subject resource to one or more related resources within a flat, text-based data system, they need special handling to represent their values as IRI-reference objects.


2.8.1 What is the purpose of association terms?


The information encoded by a Darwin Core association term property/value pair can be broken down into three components:


a link to a related resource a designation of the type of the related resource (for some terms) a description of the nature of the relationship including its direction.


The related resource is designated by some sort of identifier present in the literal value. The type of the related resource is implied by the second part of the local name (e. g., "Media", "Occurrences", etc.). The definitions of some of the terms ( dwc:associatedTaxa , dwc:associatedOccurrences , and dwc:associatedOrganisms ) also specify that the nature of the association with the subject resource should also be included in the literal value ("sibling of", "predator of ", etc.).


2.8.2 Expressing Darwin Core association terms as RDF with literal values.


A database might contain the information shown in Table 10.


These data can be serialized as RDF using the dwc: namespace literal value terms dwc:associatedOrganisms and dwc:associatedMedia as shown in Example 28.


Because the values of the association terms are literals, a consuming client would need to carry out additional processing to determine the identity of the associated resources referenced in the literals. In the case of the value for dwc:associatedOrgansims , the client would have to determine that the substring "AX3467" was an identifier for the organism and determine the nature of the relationship represented by the substring "sibling of". In the case of the value for dwc:associatedMedia , the client would need to parse the identifiers included in the value string, then determine that those substrings were IRIs.


The advantage of presenting the literal values of Darwin Core association properties via RDF as in Example 28 is that a provider could easily expose existing data with little effort. The disadvantage is that there would be a significant processing burden on consuming clients. It is possible that some literal values would be uninterpretable without additional information from another source. For example, how can the organism identified by "AX3467" be distinguished globally from other organisms that might have also been assigned the identifier "AX3467" ?


2.8.3 Expressing Darwin Core association terms as RDF with URI references.


Because a Darwin Core association term property/value pair actually encodes two or more discrete "facts", it is probably better to represent the information contained in that property/value pair by more than a single triple.


The well-known Dublin Core term dcterms:relation ( purl. org/dc/terms/relation ) can be used to link related resources. dcterms:relation does not specify the exact nature of the relationship, although it has a number of declared subproperties that more precisely specify kinds and directions of the relationships (for example: dcterms:hasPart , dcterms:isPartOf , dcterms:hasFormat , dcterms:isFormatOf , dcterms:references , dcterms:isVersionOf , etc.). So dcterms:relation is a generic term that may be used to indicate that a resource has an unspecified association with some other resource.


The term rdf:type (Section 2.3.1) is the standard property for indicating the type of a resource in RDF. So it should be used to declare the type of the object resource of a Darwin Core association term property/value pair.


The nature and direction of the association between the subject and object resource can be described more precisely if an appropriate term exists for that purpose. For example, in many cases, the relationship between a subject and object resource that are linked by dwc:associatedMedia is depiction. Thus the well known term foaf:depiction can be used to link two resources in lieu of, or in addition to dcterms:relation .


Example 29 shows how the data presented in Table 10 may be expressed as RDF using URI-reference properties instead of Darwin Core association properties.


1. Because there is no well-known term for expressing the relationship "sibling of", the nature of the relation between the two associated organisms was not represented in the triples.


2. In this example, both of the associated media items were depictions of the subject organism, so foaf:depiction was used to indicate that. However, it is likely that many associated media items will not depict the subject resource. For example, specimen labels do not depict specimens with which they are associated nor do still images of habitats depict organisms with which they are associated. Therefore, there is a need for more expressive terms to describe these types of relations more precisely. However, creating such terms is beyond the scope of this guide.


2.8.4 Querying for associated resources.


If the strategy outlined in Section 2.8.3 were used, resources associated with a subject resource could be discovered using a SPARQL query [SPARQL] similar to Example 30. In that example, <iri1> is the IRI of a subject resource, and dcmitype:StillImage is the type of associated media that would be discovered.


2.9 MeasurementOrFact instances.


Darwin Core provides a mechanism for expressing measurements and factual information associated with resources that are described using Darwin Core. Terms from the dwc: namespace that are organized in the dwc:MeasurementOrFact class were designed to express this information using string values in "flat" files. The information can be also expressed as RDF using a combination of literal value dwc: namespace terms and IRI value dwciri: terms. It is likely that this information could also be mapped to more expressive terms. However, that sort of translation is beyond the scope of this guide.


Measurement properties can be grouped as part of a dwc:MeasurementOrFact instance as shown in Example 31. In order for that instance to have meaning, it must be linked to some other resource that is the measured entity. In Example 31, the measurement took place when the occurrence of an organism was documented by its collection as a preserved specimen. The measurement was of a part of the documented organism. Given that the organism itself was preserved, the measurement also applies to the corresponding part of the specimen. Darwin Core does not provide the object properties that would be required to describe precisely how the dwc:MeasurementOrFact instance was related to the dwc:Occurrence instance, the dwc:Organism whose occurrence was recorded, or the dwc:PreservedSpecimen that was collected. In the example, dcterms:relation was used to link the dwc:MeasurementOrFact instance to the dwc:Occurrence instance that was the subject of the database record that served as the source of the data serialized as RDF in Example 31. It is possible for providers to link dwc:MeasurementOrFact instances using more expressive object properties outside of Darwin Core. See the Darwin Core informative ancillary web pages [DWC-RDF-ANCILLARY] for more information.


3 Term reference.


This section organizes terms from Darwin Core and other key vocabularies according to their use in RDF. If the use of a term has additional restrictions or implications (e. g., domain and range assertions), they are noted. Recommended formats and values are given when appropriate.


3.1 Non-Darwin Core terms needed to express fundamental properties in RDF.


3.2 Imported Dublin Core terms for which only literal objects are appropriate.


1 Recommended format is ISO 8601:2004(E) [ISO-DATES]. See notes on date terms in Section 3.4 for further information.


3.3 Imported Dublin Core terms that have non-literal objects and corresponding terms that have literal objects.


2 None of these dcterms: namespace terms have domain declarations.


3 For recommended controlled values, see the document "Sources of well-known controlled value IRIs", accessible from the Darwin Core informative ancillary web pages [DWC-RDF-ANCILLARY]


4 For more information about linking a creative work to its license, see the document "Sources of well-known controlled value IRIs", accessible from the Darwin Core informative ancillary web pages [DWC-RDF-ANCILLARY]


5 DCMI does not provide a literal object analogue of dcterms:license . Audubon Core [AUDUBON-CORE] recommends xmpRights:UsageTerms for literals.


6 DCMI does not provide a literal object analogue of dcterms:rightsHolder . Audubon Core [AUDUBON-CORE] recommends xmpRights:Owner for literals. However, since xmpRights:Owner is defined as "a list of legal owners of the resource" [XMP-SPECIFICATION], it can only be used to specify the rights owner, not an agent managing the rights.


7 See the DCMI accessRights guidelines [DC-ACCESSRIGHTS] for an example.


3.4 Terms defined by Darwin Core that are expected to be used only with literal values.


8 No Darwin Core terms defined in the Darwin Core normative RDF (as opposed to those imported from Dublin Core) have domain or range declarations as a part of their definitions. However, the five terms in the dwc: namespace listed in the table above are defined to be rdfs:subPropertyOf of dcterms:date , which has the range rdfs:Literal . Under the extensional entailment rule ext4 listed in section 7.3.1 of the RDF Semantics 2004 W3C Recommendation [RDF-SEMANTICS-2004], these terms can be inferred to have the range rdfs:Literal . However, the RDF 1.1 Semantics W3C Recommendation [RDF-SEMANTICS-1.1] does not include these extensional entailment rules. Nevertheless, it is reasonable to expect that date properties should have literal values, with datatype attributes whenever possible.


3.5 Darwin Core convenience terms that are expected to be used only with literal values.


See Section 2.7 for more information on "convenience" terms.


3.6 dwciri: terms having local names that don’t correspond to terms in the dwc: Darwin Core namespace.


3.7 dwc: namespace terms that have analogues in the dwciri: namespace.


3.8 Darwin Core terms for which this guide does not recommend the use of a dwciri: object property.


4 References.


Except where otherwise noted, content on this site is licensed under a Creative Commons Attribution 4.0 International License.


Copyright 2015 - Biodiversity Information Standards - TDWG - Contact Us.

No comments:

Post a Comment