-
Notifications
You must be signed in to change notification settings - Fork 0
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Vastlegging van eigenschappen dataset/schema #6
Comments
Als je kijkt naar wat schema.org/Dataset doet, dan vind je al een handreiking. In eerste instantie is dit een eenvoudige opzet, maar men geeft wel aan welke variabelen en welke onderzoekstechnieken gebruikt worden. De vermelding van de variabelen is voor onderzoekers zeker van belang, maar is iets wat buiten de dcat standaard ligt. Ook de gebruikte dimensies van een dataset zijn vaak van groot belang (leeftijden, geslacht, geografische specificiteit). Er is ook al een schema.org uitbreiding van deze onderdelen, die de statistische populatie en de te meten objecten opneemt. |
Het lijkt mij zeer interessant om iets van een best practice op te nemen over het verwijzen naar de gehanteerde informatiemodellen voor gestructureerde data. Dit is ontzettend belangrijk om de data te kunnen begrijpen. Niet alleen voor bijvoorbeeld de BAG of de BRK; maar ook voor een 'eenvoudige' csv.
We kunnen het hebben over of we hiervoor bijvoorbeeld MIM willen noemen, of alternatieven. Ik weet niet of het elders al is afgedekt maar ik kan mij voorstellen dat we datasets inderdaad verder gaan classificeren, zoals in het issue wordt gesuggereerd. Bijvoorbeeld als "Gestructureerd" (dan past een constraint als |
is de ISO19110 hier geen werkbare optie? dan leg je het weliswaar niet in DCAT termen vast maar je kunt er wel naar verwijzen |
Hiermee wordt bedoeld het specificeren van het soort data (gestructureerd/ongestructureerd, aanwezigheid van schema’s en formele informatiemodellen). Voor onderzoekers is informatie over de structuur van gegevens (en mogelijk ook kwaliteit) bijvoorbeeld belangrijk. Een voorbeeld hiervan is te vinden in: dataoverheid/dcat-ap-donl#2.
Vanuit het statistische domein zijn er standaarden die toegepast worden om soortgelijke informatie te beschrijven. Een veelgebruikt model is SDMX. Echter brengt het gebruik van deze specificatie ook enige complexiteit met zich mee. Vanuit de W3C is hier ook ooit een voorstel voor gemaakt. De vraag is of het gebruik van zulke oplossingen gewenst is in de context van het NL profiel, want er zijn ook andere alternatieven (bijvoorbeeld: het toevoegen van een verwijzing naar documentatie van een datamodel, via een optionele dct:conformsTo attribuut).
The text was updated successfully, but these errors were encountered: