Kwaliteitscontrole bij opname

Benoem de maatregelen die nodig zijn om de kwaliteit van digitale objecten bij opname in het digitaal archief vast te stellen.


Om wat voor type kwaliteitschecks gaat het?

Bij opname stelt een digitaal archief de kwaliteit van de digitale objecten vast. Wat krijgt het digitale archief precies in handen en voldoet het materiaal aan haar eisen? Dat kan bijvoorbeeld met de volgende kwaliteitschecks:

Viruscheck

Virussen zorgen ervoor dat de bitstream van oorspronkelijke objecten verandert. Daarom is het van belang om voorafgaand aan de opname alle binnengekomen digitale objectet te controleren of deze virusvrij zijn.

Volledigheidscheck

Hoe is de kwaliteit van de metadata? Begrijpt een organisatie de herkomst van de digitale objecten? Hoe waarborgen jullie de authenticiteit? Bewaren jullie bijvoorbeeld ook lege mappen als die meegeleverd worden is de zending compleet overgekomen? Hoe checkt de organisatie of dat het geval is? Zie ook aandachtsgebied ‘Metadata'.

Authenticiteitscheck

Het vaststellen van authenticiteit kan op een technische en niet-technische manier. Technische maatregelen bestaan onder meer uit tools om de integriteit van de bit sequentie te controleren (fixity checks) of door controle van informatie over de herkomst. Zie de uitwerking ‘Integriteitschecks‘. Niet-technische maatregelen bestaan bijvoorbeeld uit het checken van de identiteit van de producent van het digitale object. Een combinatie van beide aanpakken is gebruikelijk.

Wat zijn de risico’s als we geen maatregelen voor kwaliteitscontrole vastleggen? 

Als een digitaal archief onvoldoende kennis heeft van het materiaal dat in het digitale archief wordt opgenomen, kan ze de integriteit en betrouwbaarheid van de digitale objecten niet garanderen.


Welke vragen kunnen wij onszelf stellen?

  • Hoe waarborgen wij de authenticiteit bij opname?
  • Is onze organisatie van plan om voorafgaand aan de opname het digitaal materiaal op virussen te controleren?
  • Is onze organisatie van plan om een proces in te richten waarbij de volledigheid van de ingestroomde objecten wordt gecheckt?
  • Is onze organisatie van plan om een proces in te richten bij de opname van digitale objecten waarbij de bestandsformaten worden geïdentificeerd en gecontroleerd?
  • Beschrijft ons duurzaamheidsbeleid de verschillende activiteiten bij opname en maken deze activiteiten onderdeel uit van de standaard opnameprocedure?
hoe verwoorden andere instellingen 'Kwaliteitscontrole bij opname'

Ingest
Bij de ingest van de SIP vinden er een aantal controles en identificaties plaats. Dit zijn belangrijke randvoorwaarden voor goed beheer en beschikbaarstelling van digitale informatie. Het gaat daarbij om: 
— Karakterisatie; 
— Controles op integriteit; 
— Viruscontrole en check op beveiliging; 
— Check op de submission agreement. 
Deze controles en identificaties worden nader uitgewerkt ten aanzien van proces en te gebruiken tools hiervoor.

Bij de ingest van de SIP doen wij een aantal controles en identificaties. Dit zijn belangrijke randvoorwaarden voor goed beheer en beschikbaarstelling van digitale informatie. Het gaat om deze controles en identificaties:
• karakterisatie;
• controles op integriteit;
• viruscontrole en check op beveiliging;
• check op de submission agreement.
Karakterisatie
Karakterisatie is een verzamelnaam voor deze vijf handelingen:
1. Identificeren van het bestandsformaat. Het bestandsformaat wordt geïdentificeerd en middels een in de metadata opgeslagen unieke verwijzer aan de Technical Registry gekoppeld.
2. Valideren. Gekeken wordt of het bestandsformaat is opgebouwd volgens de technische specificaties.
3. ‘Meten’. We onderzoeken of er technische eigenschappen zijn die duurzaam beheer in de weg zouden kunnen staan. Denk aan encryptie, compressie, enzovoort. Ook dit wordt opgeslagen in de metadata, met een PUID.
4. Identificeren. van embedded objecten, bijvoorbeeld afbeeldingen of grafieken in een Word-bestand. Of van objecten in containerbestanden, bijvoorbeeld e-mails met bijlagen, webpagina’s van een website. Bestandsformaten van deze objecten worden opgeslagen in de metadata, met een PUID.
5. Identificeren van bestandseigenschappen (properties). Properties zijn bijvoorbeeld de hoogte en breedte van een afbeelding. Of het aantal bladzijden en woorden van een tekstdocument. De waarden van deze properties worden geëxtraheerd en opgeslagen in de metadata, met een PUID.

Controles op integriteit
We doen ook deze kwaliteitscontroles op integriteit:
• Metadata integrity check. We gaan na of alle content files zijn gespecificeerd in de metadata middels de correcte (relatieve) locatie.
• Content integrity check. We gaan na of de content files zijn gespecificeerd in de metadata XML en of dit consistent gebeurt.
Deze controles zorgen ervoor dat er geen content wordt opgenomen zonder metadata. En andersom: dat er geen metadata zonder content wordt opgenomen.
Een ander integriteitscontrole is de fixity check. De checksum voor elke content file vergelijken we met de originele checksum zoals gespecificeerd in de metadata. Vóór de ingest vindt deze controle plaats na elk transport (ftp, kopiëren enzovoort). Na de ingest gebeurt deze controle periodiek.

Viruscontrole en check op beveiliging
Natuurlijk is er een viruscontrole en is de beveiliging geregeld conform de eisen van de Baseline
Informatiebeveiliging Rijksdienst (BIR).

 

Uitvoeren overdrachtstest 
Het uitvoeren van een overdrachtstest is conform de ISO-norm 20652. Wanneer al eerder een overdracht uit de betreffende applicatie bij dezelfde archiefvormer heeft plaatsgevonden kan deze fase mogelijk worden overgeslagen. Ten behoeve van de test dient een representatieve selectie gemaakt te worden uit het archiefmateriaal. Deze selectie moet aan de volgende criteria voldoen: 
- Alle over te dragen dossiers dienen afgesloten te zijn; 
- Alle bestandsformaten welke aanwezig zijn dienen terug te komen in de selectie; 
- De verschillende aggregatieniveaus dienen vertegenwoordigd te zijn in de selectie; 
- De metadatering op verschillende niveaus van het archief moet terugkomen in de selectie. 

De selectie wordt overgebracht naar de quarantaine-ruimte van het e-depot. In dit deel van het e-depot wordt vervolgens gecontroleerd of de testbestanden goed zijn overgekomen. Dit bestaat uit een controle van de goede staat en een controle van de geordende en toegankelijke staat. De controle van de goede staat vindt het eerst plaats en bestaat uit de volgende punten: 
- Controle op virussen; 
- Controle van de integriteit/validiteit, door te controleren of de bestanden ongewijzigd (d.m.v. hashing) en volledig in het e-depot zijn gekomen. Is het bestandsformaat conform de eisen? 
- Controle op bruikbaarheid: zijn alle bestandsformaten door het e-depot geaccepteerd, zijn alle bestanden valide, zijn er versleutelde bestanden aanwezig (versleuteling verwijderen), zijn er gecomprimeerde mappen met bestanden aanwezig (bestanden uitpakken)? 
- Controle op authenticiteit en betrouwbaarheid: zijn digitale handtekeningen inclusief certificaat aanwezig? Vervolgens vindt een controle plaats van de geordende en toegankelijke staat: 
- Klopt de ordening van de bestanden en de aggregatieniveaus aangegeven in de metadata? 
- Zijn de minimaal vereiste metadata aanwezig? 
Mocht er iets mis gaan, dan moet bepaald worden waar dat aan ligt en hoe dit kan worden opgelost (voor het gehele archief) alvorens door te gaan naar de volgende stap.