Lopend onderzoek

Sinds de bevrijding in 1945 heeft het NIOD vele, vaak persoonlijke, documenten uit de Tweede Wereldoorlog verzameld. Een waardevol, vaak onderbelicht, deel van de NIOD-collectie bestaat uit brieven uit de periode van vlak voor, tijdens en na de Duitse bezetting van Nederland (circa 1935-1950). Het project ‘Oorlog uit Eerste Hand’ draait om de digitalisering van deze collectie oorlogsbrieven.

Het project wordt mogelijk gemaakt door financiering van het Mondriaan Fonds in het kader van de subsidieregeling ‘75 jaar Vrijheid’ en het NIOD Instituut voor Oorlogs-, Holocaust-, en Genocidestudies. 

Oorlogsbrieven
De oorlogsbrieven-collectie van het NIOD bevat onder meer brieven van vervolgde Joden, politieke gevangenen, verzetsmensen, displaced persons, vluchtelingen, oostfrontvrijwilligers of mannen in de Arbeidsinzet. Hoewel hun situaties zeer uiteenlopend waren, schreven zij allemaal ver van huis brieven naar hun geliefden, hun ouders, soms naar vrienden, bekenden of familie elders on the move. Omgekeerd schreven de vaak verontrustte thuisblijvers brieven aan hun geliefden ver weg. De brieven vertellen indringende verhalen van onderling contact tussen mensen in oorlogs- en bezettingstijd. Ze geven een beeld van het leven in een onzekere periode van geweld, bezetting, oorlog, onderdrukking, vervolging, verzet, collaboratie en schaarste - een leven waarin vrijheid en democratie vaak abstracties waren.

Project
‘Oorlog uit Eerste Hand’ heeft tot doel de collectie oorlogsbrieven van het NIOD te digitaliseren, conserveren en beter toegankelijk maken. Dit niet alleen in de NIOD-studiezaal, maar ook, waar wetgeving dit toelaat, online via de NIOD-website en het Netwerk Oorlogsbronnen. Allereerst digitaliseren we de collectie door de brieven te scannen, te transcriberen en te annoteren. ‘Oorlog uit Eerste Hand’ wil echter een stap verder gaan door daarnaast een gestructureerde, wetenschappelijke dataset te creëren die in onderzoek gebruikt kan worden voor de toepassing van bijvoorbeeld kwantitatieve tekstanalyse. Dit maakt dat de collectie niet alleen beter bewaard blijft voor het nageslacht, maar ook beschikbaar wordt gesteld op een wijze die nieuwe onderzoeksmogelijkheden biedt.

Van historische waarde 
Een digitaal ontsloten brievencollectie biedt nieuwe mogelijkheden om vragen te onderzoeken rondom emoties, ervaringen, verwachtingen, onzekerheid, stress, en veerkracht. Daarnaast biedt het inzicht in het functioneren van het bezettings-systeem. De mogelijkheden van gedigitaliseerde historische oorlogsbrieven als dataset op een meer technisch of methodologisch vlak vult deze waarde aan. Nieuwe digitale analysetechnieken hebben geleid tot het opkomen van vakgebieden als Digital Humanities en Digital History. De integratie van technieken voor computationele data- en tekstanalyse (‘text mining’) maken daar bijvoorbeeld de systematische en longitudinale studie van grote hoeveelheden historische teksten mogelijk. Het maken en beschikbaar stellen van een digitale, machine-leesbare en gestructureerde digitale dataset van historische egodocumenten kan een belangrijke impuls vormen voor methodologische en inhoudelijke vernieuwing in de geschiedwetenschap – en daarmee het onderzoek naar de Tweede Wereldoorlog en de Duitse bezetting van Nederland.

Transkribus
Het automatisch transcriberen van gedigitaliseerde handgeschreven historische archiefstukken is door ontwikkelingen in de kunstmatige intelligentie binnen handbereik gekomen. Het Europese READ project heeft tot de ontwikkeling van Transkribus geleid. Dit is een software-programma, waarmee handgeschreven gedigitaliseerd archiefmateriaal -na een trainingsproces- automatisch door een computer getranscribeerd, gemetadateerd, en gestructureerd kan worden. We noemen dit proces Handwritten Text Recognition (HTR). HTR maakt het mogelijk om handgeschreven teksten om te zetten in ‘machine-leesbare teksten’. Dit is een basisvoorwaarde voor bijvoorbeeld fulltext search, maar maakt ook text mining mogelijk. Hiervoor dient eerst een computermodel ‘getraind’ te worden op een klein deel van de brievencollectie dat handmatig getranscribeerd is. Deze transcripten worden gemaakt door een groep vrijwilligers. Vervolgens wordt een HTR-model ontwikkeld voor handgeschreven Nederlandse teksten uit de eerste helft van de twintigste eeuw. Dit computermodel zal uiteindelijk ook beschikbaar komen voor toekomstig gebruik door wetenschappers en erfgoedinstellingen. 

‘Oorlog uit Eerste Hand’ start op 1 juli 2020. De digitalisering zal naar verwachting afgerond zijn in de zomer van 2023. Het projectteam bestaat uit Annelies van Nispen (informatie-analist), Carlijn Keijzer (beleidsadviseur), Milan van Lange (onderzoeker) en Sergio Leatomu (conservering).