Torben Aastrups slægtshistorie

Startside Op Indhold Gæstebog Min slægtshistorie EDB Anetavlen Kilderne Tips og idéer Foreninger

 

 

 

 

Indekseringstjenesten
Copernic
X1
Konklusion

Søgeprogrammer til harddisken
 

horizontal rule

Resumé

At finde den berømte nål i en høstak har altid været et problem, når informationsmængderne vokser. I gamle dage blev en eller flere brevordnere taget i brug for at sikre en vis orden i papirerne. I moderne edb-tider blev brugen af diverse foldere og filnavne nødvendigt for at gøre sig håb om at kunne genfinde et givet dokument.

Med mine godt 30.000 dokumenter, filer o. lign. er andre værktøjer nødvendige for at kunne finde nålen.

Pudsigt nok er det først med internettets enorme udbredelse i slutningen af 1990erne, at der sættes fokus på værktøjer til at finde nålen med. Men det var en frustration hos folkene bag søgeprogrammet X1 over, at det var lettere at finde et dokument på internettet end på sin egen harddisk, som i 2001 blev anledningen til udviklingen af X1.

I det efterfølgende gennemgår jeg min indsats fra jeg i 1984 købte min første computer til de avancerede fuldtekst søgeprogrammer i 2005.

Principper

Der findes tre principper for søgning af tekst. Primært de fra internettet kendte søgemaskiner og så lokale søgeprogrammer til søgning på brugerens egen computer eller på (firmaets) netværk.

Den tredje mulighed er søgning inde i det program, hvor teksten dannes. Bedst kendt er søgemuligheden i e-mail programmerne, hvor man ud fra forskellige kriterier kan søge i sendte og modtagne e-mails, men ikke i filer uden for mailprogrammet. En anden kendt facilitet er journaliseringsprogrammer, hvortil det enkelte dokument knyttes til journaliseringen og samtidig gøres søgbart ved hjælp af samme program.

Historie

Efter at Microsoft tilknyttede søgeprogrammet Indekseringstjenesten i Windows 2000 og Windows XP (se min omtale her: Indekseringstjenesten), har en række forskellige firmaer herunder anmeldere gjort opmærksom på, at der fandtes søgeprogrammer til søgning af tekster m.m. på brugerens egen computer.

Ikke mindst har Googles store udbredelse af deres internetsøgeprogram gjort sit til, at computerbrugere nu er vænnet til, at man med få ord kan søge på den enorme mængde data, som internettets søgemaskiner har gjort tilgængelige.

Mit første søgeprogram til mine egne data på harddisken hed Lotus Magellan, som var udviklet af Lotus, firmaet bag regnearksprogrammet 123. (Version 2 fra 1990, Serial nr. 1112020801006594 19759 020801. Jeg har de tre 5¼” programdisketter og manualen endnu). Dette program kom frem allerede engang i 1990 men kun til DOS-styresystemet, ligesom der efter PCerens fremkomst blev udbudt andre og ofte meget dyre søgeprogrammer henvendt til især administrative arbejdspladser som eks. advokatkontorer.

Gennem årene har jeg har løbende fulgt med i, hvad der måtte komme af velegnede programmer til søgning på egne data. Desværre har andres behov og opmærksomhed for sådanne programmer været beskeden, man har klaret sig uden (eller slet ikke klaret sig). Mærkeligt nok skulle man synes, at tekstforfattere og journalister var en oplagt brugergruppe til søgeprogrammer. De professionelle programmer har prismæssigt desværre ligget uden for min rækkevidde, eller også har de været udviklet til at køre på netværk og servere. Manglende mulighed for søgning på danske bogstaver har også været et markant for ikke at sige umuligt problem.

For at skabe behovet for informationssøgning skulle vi åbenbart en omvej omkring søgemaskinerne på internettet. Nu ved de fleste, hvad udtrykket at google står for.

I stedet har jeg ligeså længe søgt at løse mine søgeproblemer ved brug af (relations)databaser, hvor jeg udtrækker nøgleoplysninger fra det enkelte dokument og indtaster disse i det relevante felt. Dette betyder desværre ekstra arbejde i form af indtastning af et udtræk af dokumentets data, ligesom behovet for relevante felter har det med at ændre sig over tid. Det ender med et behov for fuldtekstsøgning. Så de mange databaser blev ved forsøget.

Hertil har der altid været det problem, at et søgeprogram i princippet skulle kunne søge på alle filformater og ikke kun være begrænset til nogle få, hvortil kommer et ikke uvæsentligt problemer med søgning på de danske bogstaver. Begge dele var i mange år sammen med prisen en væsentlig forhindring for mig i at kunne anskaffe et sådan program.

Mit Magellan program måtte jeg således stoppe med at bruge, da Windows afløste DOS-styresystemet.

Situationen i 2004/2005

Som sagt med Microsofts indbygning af Indekseringstjenesten i Windows 2000 og XP lagde firmaet ligesom op til, at nu skulle andre firmaer udbyde dedikerede søgeprogrammer. Indekseringstjenesten er et meget avanceret program, der i princippet giver adgang til stort set alle faciliteter, der direkte eller indirekte ligger gemt i en fil eller på harddisken.

Indekseringstjenesten er ikke særligt brugervenlig, men det kan for den erfarne finde den berømte nål i en høstak, når man ellers får lært det knudrede søgesprog.

Ikke mindst Googles planer om at udbyde et gratis søgeprogram til brugerens egen computer satte gang i andre programudviklere. Googles søgeprogram virker i princippet på samme måde, uanset om du søger på internettet eller din egen computer.

Med et slangudtryk siger vi i dag at google i stedet for at søge eller finde.

Efter Google havde offentliggjort deres planer om et lokalt søgeprogram barslede såvel Microsoft som Yahoo! også med løfter om at udvikle og tilbyde et gratis søgeprogram til den lokale computer. For disse tre udbydere er det karakteristisk, at de samtidig tilbyder søgemaskiner til internettet, og begge dele er gratis delvist finansieret ved annoncer i søgeresultatet.

Situationen omkring midten af 2005 er, at der er en række søgeprogrammer, der mod betaling eller gratis for brugeren kan installeres på vedkommendes egen computer og/eller på netværk.

Indeksering af filformater

Det er af afgørende betydning, at et søgeprogram kan finde informationerne i så mange forskellige filformater som muligt. Uagtet Word nok er det mest udbredte filformat, så findes der faktuelt en del andre filformater i edb-verdenen.

Hertil kommer gamle filformater fra DOS verdenens barndom. I sig selv er det et problem at bevare adgangen til de gamle filformater for nutiden. Faktisk kræver det ofte særlige programmer, der kan læse de gamle filformater. På dette punkt springer nogle af programmerne over, hvor gærdet er lavest og nøjes med de mest udbredte Word, html- og pdf-formater.

Søgeprogrammer tilknyttet internetsøgemaskiner:

Yahoo! Desktop Search (baseret på betalingsprogrammet X1)

MSN (Microsoft) Toolbar Suite

Google Desktop

Gratis søgeprogrammer:

Copernic Desktop Search

Ask Jeeves (beta)

Blinkx

HotBot Desktop

Betalingsprogrammer:

Wizetech Archivarius 3000 ($25-$40)

Enfish Professional ($200)

ISYS Desktop ($570)

dtSearch Desktop ($199)

diskMETA Pro ($98)

(Listen er hentet fra en rapport udgivet 20-04-2005 og skrevet af Tom Noda og Shawn Helwig, University of Wisconsin-Madison (UWM): Benchmark Study of Destop Search Tools, There’s More to Search than Google & Yahoo!, An Evaluation of 12 Leading Desktop Search Tools. Rapporten kan hentes på www.uwebc.org/decisiontools.)

Herudover er jeg bekendt med flg. søgeprogram:

X1 fra X1 Technologies ($ 75) (www.x1.com) og som også er grundstammen i søgeprogrammet fra Yahoo! Programmet har de samme programmører bag sig som Lotus Magellan. Kilde: www.x1.com. Se særskilt anmeldelse.

 

Benchmark Study of Destop Search Tools

Ovennævnte rapport gennemgår som sagt 12 af de førende (mest udbredte) søgeprogrammer og vurderer dem på en lang række kriterier med hovedgrupperne: brugervenlighed, omfang og dybde af søgefaciliteter, nøjagtighed, effektivitet i forhold til brugen af computeren, sikkerhed og egnethed til brug i netværk.

Sikkerhed og brugen i netværk er ikke uventet akilleshælen i de fleste undersøgte programmer, efter som de primært henvender sig til den private edb-bruger, hvor dette ikke er det store problem.

Rapporten udpeger programmet Copernic Desktop Search fra firmaet Copernic som det suverænt bedste program ud fra de fire første kriterier. Da denne version af programmet tilmed er gratis, har jeg valgt at afprøve dette på min egen computer, og version 1.6 Beta (721) blev derfor installeret den 11-07-2005. Anmeldelsen kan ses her.

Herudover har jeg også valgt at afprøve X1, som i den særlige version tilknyttet Yahoo! Desktop Search kom ind som det andet bedste program. Det blev grundet manglerne ved gratisudgaven af Copernic til en afprøvning af betalingsversionen af X1 ud fra en formodning om, at gratisudgaverne formodentlig vil have mangler, som jeg har svært ved at klare mig uden. Jeg installerede derfor prøveversion af 5.2.2 den 12-07-2005. Anmeldelsen kan ses her.

 


13-07-2005 Torben Aastrup
 

Denne note er ajourført 18-07-2005

horizontal rule