Digitalisering og sikring af slægtsmaterialet for eftertiden
Resumé
Det efterfølgende indeholder en beskrivelse af mine initiativer
omkring sikring af slægtens skriftlige materialer for eftertiden. Dels er der
tale om omfattende materialer, dels kan disse forgå og endelige er der
spørgsmålet omkring mangfoldiggørelse til relevante personer, lokalarkiver,
internettet o. lign.
2001
I et par e-mails fra den 19-04-2001 og 15-07-2001 fremlagde jeg
flg. tanker omkring digitalisering og sikring af familiens slægtsmateriale.
Efterfølgende den 21-08-2001 nedfældede jeg konklusionen af disse tanker i et
notat specielt omkring problemet med at sikre familiens fotos: Digitalisering og
bevaring af familiens fotos for eftertiden (se dette).
Slægtens skriftlige materialer
Min mor har gennem 25 år samlet store datamængder, som foreligger i 6 ringbind.
Problemet er at få materialet bevaret for eftertiden. Selv papir forgår, og
kopiering af store mængder er en tilsvarende stor opgave, ligesom kopierne
forringes fra gang til gang. Mangfoldiggørelse til lokalarkiver eller andre
slægtsforskere kan være et problem med den traditionelle teknik.
Digitalisering
Af disse grunde vil jeg have alt mit materiale digitaliseret, samtidig med at
jeg selvfølgelig bevarer det originale materiale i dets oprindelige form.
Med digitaliseringen opnår jeg også en nemmere adgang til at finde oplysningerne
i det omfattende materiale. Jeg brugte i 2001 eksempelvis Alta Vistas Discovery
til at indexere alle mine data. Desværre har Alta Vista stoppet med dette
program, afløseren blev Window 2000 og XP's Indekseringstjeneste, som giver
mulighed for fuldtekstsøgning i alle filer skrevet i visse filformater.
Men til søgning i data anbragt på internettet som hjemmesider findes der et hav
af såkaldte søgemaskiner eks. Google, der i et vist omfang giver adgang til
søgning på keywords eller uddrag af det enkelte dokument, ligesom nogle
søgemaskiner kan bruges til fuldtekstsøgning på alle dine egne hjemmesider.
Digitalisering af slægtsmaterialet rejser spørgsmålet om, hvilke programmer og
filformater skal man bruge, som er alment udbredt i tiden, og som på lang sigt
overlever eller kan konvertes til nye programmer, nye filformater eller sågar
helt nye styresystemer, så man også kan læse materialet om 25 og 50 år. Hvem ved
eksempelvis, om Windows er det mest udbredte styresystem om 50 år?
Originalt materiale
De originale skriftlige materialer overleveret i familien, hvor
jeg enten er i besiddelse af originalen eller har taget en fotokopi af denne
scanner jeg.
Scanningen sker i sort-hvid bitmap, som er et format, der nærmer
sig fax-formatet. Kvaliteten er tilstrækkelig god til almindelig tekst men egner
sig ikke for grafik. En scanning i dette format af et A4 dokument i 300 dpi og
gemt i komprimeret tiff-format fylder omkring 70 kBytes, men opløsningen kan
reduceres til 150 dpi.
Når jeg bruger 300 dpi, så er det af hensyn til en efterfølgende
OCR-behandling (tekstgenkendelse), som jeg udfører for alle maskinskrevne
dokumenter, så jeg har en søgbar tekst.
Alle scannede dokumenter gemmes i et tekstbehandlingsdokument.
Dokumenter skrevet med håndskrift med et resumé eller den fulde tekst skrevet
med maskinskrift sammen med tiff-udgaven af det originale dokument.
Maskinskrevne dokumenter gemmes med ocr-resultatet og tiff-udgaven af det
originale dokument.
Endelig suppleres dokumentet med oplysninger om personen i
dokumentet og andre oplysninger, der kan belyse netop dette dokument.
På denne måde sikrer jeg det originale materiale og giver
mulighed for at udveksle dokumentet elektronisk med andre.
Kopimateriale d. v. s. kopi af eks. kirkebøger, folketællinger o.
lign. materialer bliver behandlet på samme måde.
Fil-formater
PDF-formatet anvendes i stigende omfang til at publicere tekster med billeder og
grafik på internettet.
Jeg er ikke i tvivl om, at Acrobat med deres gratis-princip for læseprogrammet
og et rimelig pris for skriveprogrammet er på vej til at sætte verdensstandard
for dokumenthåndteringsprogrammer, der er krævende ift. layout.
Men jeg synes, at det er besværligt at bruge, når du løbende skal rette i din
fil. Der forekommer et almindeligt tekstbehandlingsprogram nemmere. Men når mine
dokumenter foreligger i en endelig udgave, taler meget for at konvertere til
pdf-formatet.
Jeg tror, at html og xml-formaterne på lang sigt vil erstatte alle andre
filformater. Internettet vil allerede inden for de næste 10 år være den
internationale standard, som alt skrives og udgives i (og en medvirkende årsag
til, at Windows udgår som styresystem, ikke mindst tagets dets manglende
popularitet i betragtning), ligesom man vil være gået helt bort fra papirmediet
- tænk blot på udviklingen med internettet inden for de sidste 5 år.
Men indtil da har jeg valgt at bruge Microsoft Word som tekstbehandlingsprogram
og gemme filerne i .doc formatet. Med udbredelsen af Word over hele verden vil
der være sikkerhed for, at formatet vil fortsætte i mange år endnu, eller der
vil kunne ske en konvertering til nye formater eks. pdf, html eller xml eller
andre endnu ikke kendte filformater.
Inden for slægtsprogrammer har man i et vist omfang løst problemet med den
internationalt anerkendte Gedcom-standard. Men hver enkelt slægtsprogram har
alligevel nogle faciliteter, som andre ikke har.
Derfor holder jeg også løbende øje med programmer, der kan håndtere alt
slægtsmateriale i pdf-, html eller xml-formater. Sidst har jeg således set
programmet Familia fra Israel, der tilsyneladende kan håndtere en Gedcom-dannet
slægtsdatabase sammen med billeder med entydig relation til de enkelte aner.
Fælles standarder
Man burde på internationalt plan gå igang med en debat om, hvordan og med hvilke
programmer vil vi gemme vores slægtmaterialer. Skal det have nogen mening at
bruge så meget tid på at finde vores rødder, synes det også oplagt, at vores
slægtsinformationer fortsat skal være elektronisk tilgængelige om 25, 50 og 100
år.
Det Kongelige Bibliotek m.fl. arbejder pt. meget seriøst på en national løsning
med at sikre hjemmesiderne for eftertiden. Dette taler i så fald for
html-filformatet.
Da vi her i Århus for 10 år siden startede med at lægge folketællingen for Århus
1845 ind i Paradox, brugte vi megen tid på at drøfte disse problemer.
Dansk Data Arkiv (DDA) havde og har det som en af deres grundidéer løbende at
konvertere til aktuelle formater og programmer. Men vi vil næppe kunne forvente,
at de vil påtage sig opgaven med vores slægtsmateriale.
Paradox er i dag et lidet udbredt databaseprogram, Access fra Microsoft er måske
forsvundet om 10 år.
Mit anetræet eksisteret i dag kun i elekronisk udgave i Brother's Keeper. Når
jeg overvejer at overgå til mormonernes Personal Ancestral File [PAF], er det
hensynet til at sikre mine slægtsdata for eftertiden. Uden at være religiøs kan
jeg have en stærk formodning om, at mormonerne formodentlig i mange generationer
fremover vil kunne garantere en sikring af slægtsdataene og ikke mindst i deres
eget program. Men jeg kender dog ikke programmet.
html-formatet
Med etableringen af mine egne hjemmesider rykker html-formatet
tættere på. Der er jo ikke noget teknisk til hinder for, at de ovenfor anførte
dokumenter kan gemmes i et html-dokument. Omvendt kan man jo knytte så godt som
alle dokumentformater til en hjemmeside. Her ligger der et opgave, der skal
undersøges nærmere.
19-04-2001 og 15-07-2001, revideret 30-12-2003 og 17-01-2004 Torben Aastrup