Sidst opdateret d. 11. januar 2024

Kortlægning af fund fra eksterne datasæt

Hvordan foregår importen af fund fra andre datasæt til Arter ?

Data fra eksterne datasæt tilflyder ikke Arter direkte. På deres vej runder de GBIF (Global Biodiversity Information Facility), der indsamler oplysninger om fund og navne fra en lang række datasæt fra hele verden, inkl. Arter, og udstiller dem via websiden GBIF.org.

Samtlige navne i eksterne datasæt fortolkes automatisk af GBIF. En del navne findes imidlertid ikke på GBIF. I disse tilfælde vil de ofte blive forsøgt mappet til et højere niveau. I mange tilfælde opfattes navnene i de eksterne datasæt som synonymer for andre arter, og enkelte taxa kan ikke mappes automatisk. Forskelle i stavemåde eller angivelse af autor kan også føre til uheldige eller manglende mapninger.

Atlasprojekter

For flere af de danske atlasundersøgelser foreligger komplette datasæt. Fund fra disse og mange andre er gjort tilgængelige på Arter via GBIF.

Regler for videnskabelige navne, men...

Modsat danske navne er der regler for brugen af videnskabelige navne. Det vil bl.a. derfor nok komme bag på mange, at der ofte er store uoverensstemmelser i brugen af videnskabelige navne. Det gælder såvel hvilket navn, der er det gældende, og hvilke der er synonymer, samt den nøjagtige stavemåde og angivelsen af autoren (navnet på personen, der beskrev pågældende taxon og evt. årstal for beskrivelsen). Hertil kommer uoverensstemmelser omkring klassifikation – altså tilhørsforhold til familie, orden, klasse etc.

Det er vigtigt at påpege, at GBIF ikke er en taxonomisk autoritet  og (ligesom alle dets dataleverandører inkl. Arter) langt fra er fejlfri. Hvor der er to eller flere navne i spil for det samme taxon, vil det ofte vil det være et subjektivt valg, hvem man vil ”holde med”. Og med de astronomiske datamængder, der efterhånden er i spil, er det ikke så mærkeligt, at der opstår fejl, mangler og mærkværdigheder.

I flere tilfælde er GBIF’s fortolkning af navne ikke hensigtsmæssig ifm. Taxonbasen og Arter. Det skal også nævnes, at GBIF ikke opererer med mellemliggende niveauer over artsniveau såsom underorden og infraklasse, men kun de overordnede niveauer (rige, række, klasse, orden, familie, slægt, art).

For at sikre en større overensstemmelse mellem originale datasæt og Arter, er der i en række af datasættene indført en kolonne med taxonID fra Arter. Hvis et fund fra et eksternt datasæt har et taxonID tilknyttet, mappes det ”indenom” GBIF, så vi på Arter ikke er afhængige af GBIF’s fortolkning.

For hvert enkelt fund fra eksterne datasæt, kan man på GBIF se, hvilket navn, der indgår i hhv. det oprindelige datasæt, og hvordan dette navn fortolkes af GBIF. Man kan således til en hver tid gå tilbage til kilden og se de eventuelle uoverensstemmelser.

Til alt held kan man på GBIF til enhver tid se navnet i det oprindelige datasæt og se GBIF’s fortolkning af dette navn.

Se Fund På GBIF

Vælger man på et fund fra en ekstern kilde på Arter, kan man med et enkelt klik komme videre til GBIFs fortolkning af fundet.

GBIF Fortolkning

Her ses et eksempel, hvor GBIF ikke genkender arten i det eksterne datasæt og i stedet mapper fundet til slægtsniveau. Som nævnt i teksten ovenfor, kan Arter i mange tilfælde gå indenom GBIF og mappe navnet direkte vha. TaxonID.

Hvis der i et eksternt datasæt optræder fund med et navn, som ikke findes på Arter, bliver disse automatisk føjet til en liste over ikke-kortlagte fund, der kan fremsøges på Arter. Denne liste bliver med mellemrum manuelt gennemgået, og årsagen til det manglende match undersøges. Der kan være tale om synonymer, som vi ikke har i systemet eller forskelle i stavemåde eller angivelse af autor, men det kan også bero på fejlbestemmelser - eller mere interessant - hidtil ukendte taxa for Danmark.

Nogle datasæt er statiske, og kortlægningen skal blot foretages en enkelt gang. Andre er dynamiske og bliver synonkroniseret med Arter med en eller flere ugers mellemrum. De sidstnævnte bliver derfor genbesøgt med mellemrum.

Visse fund bliver ikke importeret til Arter. Det kan f.eks. være fund uden georeferering eller fund uden dato. Der vil således ofte være uoverensstemmelse mellem angivelsen af antal af fund i et datasæt mellem GBIF og Arter.

Den øgede samkørsel af databaser på kryds og tværs af landegrænser og taxonomiske grupper, fører til mange udfordringer ift. tidligere, hvor f.eks. forløberen for Arter, Allearter.dk, i starten blot var statiske lister.

Til gengæld vil det være en kæmpe gevinst på den lange bane. Vi må så blot acceptere, at der er en årrække, hvor tingene kan være lidt svære at overskue.

 

Beslægtede emner