Torben Aastrups slægtshistorie

Startside Op Indhold Gæstebog Min slægtshistorie EDB Anetavlen Kilderne Tips og idéer Foreninger Fotoalbum

 

 

 

 

Digitalisering og sikring af slægtsmaterialet for eftertiden
 

horizontal rule

Resumé

Det efterfølgende indeholder en beskrivelse af mine initiativer omkring sikring af slægtens skriftlige materialer for eftertiden. Dels er der tale om omfattende materialer, dels kan disse forgå og endelige er der spørgsmålet omkring mangfoldiggørelse til relevante personer, lokalarkiver, internettet o. lign.

2001

I et par e-mails fra den 19-04-2001 og 15-07-2001 fremlagde jeg flg. tanker omkring digitalisering og sikring af familiens slægtsmateriale. Efterfølgende den 21-08-2001 nedfældede jeg konklusionen af disse tanker i et notat specielt omkring problemet med at sikre familiens fotos: Digitalisering og bevaring af familiens fotos for eftertiden (se dette).

Slægtens skriftlige materialer

Min mor har gennem 25 år samlet store datamængder, som foreligger i 6 ringbind. Problemet er at få materialet bevaret for eftertiden. Selv papir forgår, og kopiering af store mængder er en tilsvarende stor opgave, ligesom kopierne forringes fra gang til gang. Mangfoldiggørelse til lokalarkiver eller andre slægtsforskere kan være et problem med den traditionelle teknik.

Digitalisering

Af disse grunde vil jeg have alt mit materiale digitaliseret, samtidig med at jeg selvfølgelig bevarer det originale materiale i dets oprindelige form.

Med digitaliseringen opnår jeg også en nemmere adgang til at finde oplysningerne i det omfattende materiale. Jeg brugte i 2001 eksempelvis Alta Vistas Discovery til at indexere alle mine data. Desværre har Alta Vista stoppet med dette program, afløseren blev Window 2000 og XP's Indekseringstjeneste, som giver mulighed for fuldtekstsøgning i alle filer skrevet i visse filformater.

Men til søgning i data anbragt på internettet som hjemmesider findes der et hav af såkaldte søgemaskiner eks. Google, der i et vist omfang giver adgang til søgning på keywords eller uddrag af det enkelte dokument, ligesom nogle søgemaskiner kan bruges til fuldtekstsøgning på alle dine egne hjemmesider.

Digitalisering af slægtsmaterialet rejser spørgsmålet om, hvilke programmer og filformater skal man bruge, som er alment udbredt i tiden, og som på lang sigt overlever eller kan konvertes til nye programmer, nye filformater eller sågar helt nye styresystemer, så man også kan læse materialet om 25 og 50 år. Hvem ved eksempelvis, om Windows er det mest udbredte styresystem om 50 år?
 

Originalt materiale

De originale skriftlige materialer overleveret i familien, hvor jeg enten er i besiddelse af originalen eller har taget en fotokopi af denne scanner jeg.

Scanningen sker i sort-hvid bitmap, som er et format, der nærmer sig fax-formatet. Kvaliteten er tilstrækkelig god til almindelig tekst men egner sig ikke for grafik. En scanning i dette format af et A4 dokument i 300 dpi og gemt i komprimeret tiff-format fylder omkring 70 kBytes, men opløsningen kan reduceres til 150 dpi.

Når jeg bruger 300 dpi, så er det af hensyn til en efterfølgende OCR-behandling (tekstgenkendelse), som jeg udfører for alle maskinskrevne dokumenter, så jeg har en søgbar tekst.

Alle scannede dokumenter gemmes i et tekstbehandlingsdokument. Dokumenter skrevet med håndskrift med et resumé eller den fulde tekst skrevet med maskinskrift sammen med tiff-udgaven af det originale dokument. Maskinskrevne dokumenter gemmes med ocr-resultatet og tiff-udgaven af det originale dokument.

Endelig suppleres dokumentet med oplysninger om personen i dokumentet og andre oplysninger, der kan belyse netop dette dokument.

På denne måde sikrer jeg det originale materiale og giver mulighed for at udveksle dokumentet elektronisk med andre.

Kopimateriale d. v. s. kopi af eks. kirkebøger, folketællinger o. lign. materialer bliver behandlet på samme måde.

Fil-formater

PDF-formatet anvendes i stigende omfang til at publicere tekster med billeder og grafik på internettet.

Jeg er ikke i tvivl om, at Acrobat med deres gratis-princip for læseprogrammet og et rimelig pris for skriveprogrammet er på vej til at sætte verdensstandard for dokumenthåndteringsprogrammer, der er krævende ift. layout.

Men jeg synes, at det er besværligt at bruge, når du løbende skal rette i din fil. Der forekommer et almindeligt tekstbehandlingsprogram nemmere. Men når mine dokumenter foreligger i en endelig udgave, taler meget for at konvertere til pdf-formatet.

Jeg tror, at html og xml-formaterne på lang sigt vil erstatte alle andre filformater. Internettet vil allerede inden for de næste 10 år være den internationale standard, som alt skrives og udgives i (og en medvirkende årsag til, at Windows udgår som styresystem, ikke mindst tagets dets manglende popularitet i betragtning), ligesom man vil være gået helt bort fra papirmediet - tænk blot på udviklingen med internettet inden for de sidste 5 år.

Men indtil da har jeg valgt at bruge Microsoft Word som tekstbehandlingsprogram og gemme filerne i .doc formatet. Med udbredelsen af Word over hele verden vil der være sikkerhed for, at formatet vil fortsætte i mange år endnu, eller der vil kunne ske en konvertering til nye formater eks. pdf, html eller xml eller andre endnu ikke kendte filformater.

Inden for slægtsprogrammer har man i et vist omfang løst problemet med den internationalt anerkendte Gedcom-standard. Men hver enkelt slægtsprogram har alligevel nogle faciliteter, som andre ikke har.

Derfor holder jeg også løbende øje med programmer, der kan håndtere alt slægtsmateriale i pdf-, html eller xml-formater. Sidst har jeg således set programmet Familia fra Israel, der tilsyneladende kan håndtere en Gedcom-dannet slægtsdatabase sammen med billeder med entydig relation til de enkelte aner.

Fælles standarder

Man burde på internationalt plan gå igang med en debat om, hvordan og med hvilke programmer vil vi gemme vores slægtmaterialer. Skal det have nogen mening at bruge så meget tid på at finde vores rødder, synes det også oplagt, at vores slægtsinformationer fortsat skal være elektronisk tilgængelige om 25, 50 og 100 år.

Det Kongelige Bibliotek m.fl. arbejder pt. meget seriøst på en national løsning med at sikre hjemmesiderne for eftertiden. Dette taler i så fald for html-filformatet.

Da vi her i Århus for 10 år siden startede med at lægge folketællingen for Århus 1845 ind i Paradox, brugte vi megen tid på at drøfte disse problemer.

Dansk Data Arkiv (DDA) havde og har det som en af deres grundidéer løbende at konvertere til aktuelle formater og programmer. Men vi vil næppe kunne forvente, at de vil påtage sig opgaven med vores slægtsmateriale.

Paradox er i dag et lidet udbredt databaseprogram, Access fra Microsoft er måske forsvundet om 10 år.

Mit anetræet eksisteret i dag kun i elekronisk udgave i Brother's Keeper. Når jeg overvejer at overgå til mormonernes Personal Ancestral File [PAF], er det hensynet til at sikre mine slægtsdata for eftertiden. Uden at være religiøs kan jeg have en stærk formodning om, at mormonerne formodentlig i mange generationer fremover vil kunne garantere en sikring af slægtsdataene og ikke mindst i deres eget program. Men jeg kender dog ikke programmet.
 

html-formatet

Med etableringen af mine egne hjemmesider rykker html-formatet tættere på. Der er jo ikke noget teknisk til hinder for, at de ovenfor anførte dokumenter kan gemmes i et html-dokument. Omvendt kan man jo knytte så godt som alle dokumentformater til en hjemmeside. Her ligger der et opgave, der skal undersøges nærmere.


19-04-2001 og 15-07-2001, revideret 30-12-2003 og 17-01-2004 Torben Aastrup
 

Denne note er ajourført 17-10-2005

horizontal rule