Kwaliteitscontrole bij opname

Benoem de maatregelen die nodig zijn om de kwaliteit van digitale objecten bij opname in het digitaal archief vast te stellen.


Om wat voor type kwaliteitschecks gaat het?

Bij opname stelt een digitaal archief de kwaliteit van de digitale objecten vast. Wat krijgt het digitale archief precies in handen en voldoet het materiaal aan haar eisen? Dat kan bijvoorbeeld met de volgende kwaliteitschecks:

Viruscheck

Virussen zorgen ervoor dat de bitstream van oorspronkelijke objecten verandert. Daarom is het van belang om voorafgaand aan de opname alle binnengekomen digitale objectet te controleren of deze virusvrij zijn.

Volledigheidscheck

Hoe is de kwaliteit van de metadata? Begrijpt een organisatie de herkomst van de digitale objecten? Hoe waarborgen jullie de authenticiteit? Bewaren jullie bijvoorbeeld ook lege mappen als die meegeleverd worden is de zending compleet overgekomen? Hoe checkt de organisatie of dat het geval is? Zie ook aandachtsgebied ‘Metadata'.

Authenticiteitscheck

Het vaststellen van authenticiteit kan op een technische en niet-technische manier. Technische maatregelen bestaan onder meer uit tools om de integriteit van de bit sequentie te controleren (fixity checks) of door controle van informatie over de herkomst. Zie de uitwerking ‘Integriteitschecks‘. Niet-technische maatregelen bestaan bijvoorbeeld uit het checken van de identiteit van de producent van het digitale object. Een combinatie van beide aanpakken is gebruikelijk.

Wat zijn de risico’s als we geen maatregelen voor kwaliteitscontrole vastleggen? 

Als een digitaal archief onvoldoende kennis heeft van het materiaal dat in het digitale archief wordt opgenomen, kan ze de integriteit en betrouwbaarheid van de digitale objecten niet garanderen.


Welke vragen kunnen wij onszelf stellen?

  • Hoe waarborgen wij de authenticiteit bij opname?
  • Is onze organisatie van plan om voorafgaand aan de opname het digitaal materiaal op virussen te controleren?
  • Is onze organisatie van plan om een proces in te richten waarbij de volledigheid van de ingestroomde objecten wordt gecheckt?
  • Is onze organisatie van plan om een proces in te richten bij de opname van digitale objecten waarbij de bestandsformaten worden geïdentificeerd en gecontroleerd?
  • Beschrijft ons duurzaamheidsbeleid de verschillende activiteiten bij opname en maken deze activiteiten onderdeel uit van de standaard opnameprocedure?
hoe verwoorden andere instellingen 'Kwaliteitscontrole bij opname'

Ingestroomde objecten worden gecheckt en gevalideerd volgens een aantal strikte ingestprocedures waarbij structureel een aantal (kwaliteits)controles plaatsvindt op de compleetheid van de aangeleverde files, het voldoen van het formaat aan de standaard en de aanwezigheid en de kwaliteit van de metadata. Voor erfgoedcollecties en commerciële diensten werkt Beeld en Geluid standaard met checksums die vóór instroom in het Digitaal Archief door de depotgever/dataproducer worden gemaakt en meegeleverd. Bij de publieke omroepcollecties worden checksums niet meegeleverd door de depotgever. In deze gevallen wordt de zgn. header-and-footer check van de file gebruikt om te controleren of de file (in dit geval de MXF) compleet is. Deze controle garandeert dat het bestand volledig is overgekomen en dat het transport niet halverwege is afgebroken.

Onderdelen van de ingestworkflow bij Beeld en Geluid bestaan uit: een fixitycheck op basis van de aangeleverde checksum of een head-and-footercheck, formaatbepaling, extractie technische metadata, kwaliteits- en volledigheidscontrole essence (AV-content) en metadata en toewijzing identifier. De normatieve onderdelen van de de ingestworkflow staan gedocumenteerd in het Informatiemodel van Beeld en Geluid. Dit model is gebruikt als referentie bij implementatie van de workflows in het MAM-systeem.

 

De opname of ‘ingest’ (het OAIS-model is beschreven in het Engels) is de eerste functionele component van het OAIS-referentiemodel. Deze omvat de ontvangst van informatie van een producent en de bevestiging dat de verstrekte informatie volledig is. Tijdens dit proces worden ook de specifieke kenmerken van de te preserveren informatie geïdentificeerd: er wordt geverifieerd dat de informatie is wat het geacht wordt te zijn. Het Archief werkt in principe als zelfbedieningssysteem: de dataproducent zelf is verantwoordelijk voor de documentatie en deponering van zijn of haar data.

De medewerkers van het Archief voeren kwaliteitscontroles uit aan de hand van een dataverwerkingsprotocol om te waarborgen dat de aangeleverde data op de lange termijn vindbaar, toegankelijk en begrijpelijk blijven.

Bij de ingest van de SIP (Submission Information Package) wordt een aantal controles en identificaties uitgevoerd die randvoorwaardelijk zijn voor goed beheer en beschikbaarstelling van digitale informatie:

  • Karakterisatie is een verzamelterm voor de volgende handelingen:
    • Identificatie: het bestandsformaat wordt geïdentificeerd en middels een in de metadata opgeslagen unieke verwijzer aan de Technical Registry gekoppeld.
    • Validatie: gekeken wordt of het bestandsformaat volgens de technische specificaties is opgebouwd.
    • “Meten” van technische eigenschappen die eventueel duurzaam beheer in de weg kunnen staan (denk aan encryptie, compressie) Ook dit wordt middels een PUID opgeslagen in de metadata.
    • Identificeren van embedded objecten (bijv. afbeeldingen of grafieken in een Wordbestand) of objecten in containerbestanden (e-mail met bijlagen, webpagina’s van een website): bestandsformaten van deze objecten worden middels een PUID opgeslagen in de metadata.
    • Identificeren van bestandseigenschappen. De waarden van deze properties worden geëxtraheerd en samen met een verwijzing naar de eigenschap middels een PUID opgeslagen. Denk aan hoogte en breedte van een afbeelding, aantal pagina’s/woorden van een tekstdocument etc.
  • Controles
    Daarnaast is sprake van een aantal kwaliteitscontroles met betrekking tot de integriteit zoals hier genoemd:
    • Metadata Integrity check: er wordt nagegaan of alle content files zijn gespecificeerd in de metadata middels de correcte (relatieve) locatie;
    • Content Integrity check: er wordt nagegaan of de content files zijn gespecificeerd in de metadata xml en dat dit consistent gebeurt.
      Door bovenstaande controles uit te voeren zorg je ervoor dat er geen content wordt opgenomen zonder metadata en er geen metadata wordt opgenomen zonder content.

Een ander integriteitscontrole is de Fixity Check. De checksum voor elke content file wordt vergeleken met de originele checksum gespecificeerd in de metadata. Deze controle vindt na ingest periodiek plaats. Voor de ingest kan hij na elk transport (ftp, kopiëren, etc) ook worden gecontroleerd.

En natuurlijk vindt de viruscontrole plaats en is de beveiliging geregeld conform de eisen van de Baseline Informatiebeveiliging Rijksdienst (BIR).

 

Digital resources which are selected for preservation will be accessioned into an appropriate preservation environment. The process of accessioning encompasses both steps to bring those resources under intellectual control (e.g. cataloguing and transfer of custody), and the more technical processes of ingest, which may include characterisation (see 5.5.1), quarantine, validation, and the physical transfer of digital objects and metadata into a digital repository environment.