At finde den berømte nål i en høstak har altid været et problem, når
informationsmængderne vokser. I gamle dage blev en eller flere brevordnere taget
i brug for at sikre en vis orden i papirerne. I moderne edb-tider blev brugen af
diverse foldere og filnavne nødvendigt for at gøre sig håb om at kunne genfinde
et givet dokument.
Med mine godt 30.000 dokumenter, filer o. lign. er andre værktøjer nødvendige
for at kunne finde nålen.
Pudsigt nok er det først med internettets enorme udbredelse i slutningen af
1990erne, at der sættes fokus på værktøjer til at finde nålen med. Men det var
en frustration hos folkene bag søgeprogrammet X1 over, at det var lettere at
finde et dokument på internettet end på sin egen harddisk, som i 2001 blev
anledningen til udviklingen af X1.
I det efterfølgende gennemgår jeg min indsats fra jeg i 1984 købte min første
computer til de avancerede fuldtekst søgeprogrammer i 2005.
Principper
Der findes tre principper for søgning af tekst. Primært de fra internettet
kendte søgemaskiner og så lokale søgeprogrammer til søgning på brugerens egen
computer eller på (firmaets) netværk.
Den tredje mulighed er søgning inde i det program, hvor teksten dannes. Bedst
kendt er søgemuligheden i e-mail programmerne, hvor man ud fra forskellige
kriterier kan søge i sendte og modtagne e-mails, men ikke i filer uden for
mailprogrammet. En anden kendt facilitet er journaliseringsprogrammer, hvortil
det enkelte dokument knyttes til journaliseringen og samtidig gøres søgbart ved
hjælp af samme program.
Historie
Efter at Microsoft tilknyttede søgeprogrammet Indekseringstjenesten i
Windows 2000 og Windows XP (se min omtale her: Indekseringstjenesten), har en
række forskellige firmaer herunder anmeldere gjort opmærksom på, at der fandtes
søgeprogrammer til søgning af tekster m.m. på brugerens egen computer.
Ikke mindst har Googles store udbredelse af deres internetsøgeprogram gjort sit
til, at computerbrugere nu er vænnet til, at man med få ord kan søge på den
enorme mængde data, som internettets søgemaskiner har gjort tilgængelige.
Mit første søgeprogram til mine egne data på harddisken hed Lotus Magellan, som
var udviklet af Lotus, firmaet bag regnearksprogrammet 123. (Version 2 fra 1990,
Serial nr. 1112020801006594 19759 020801. Jeg har de tre 5¼” programdisketter og
manualen endnu). Dette program kom frem allerede engang i 1990 men kun til
DOS-styresystemet, ligesom der efter PCerens fremkomst blev udbudt andre og ofte
meget dyre søgeprogrammer henvendt til især administrative arbejdspladser som
eks. advokatkontorer.
Gennem årene har jeg har løbende fulgt med i, hvad der måtte komme af velegnede
programmer til søgning på egne data. Desværre har andres behov og opmærksomhed
for sådanne programmer været beskeden, man har klaret sig uden (eller slet ikke
klaret sig). Mærkeligt nok skulle man synes, at tekstforfattere og journalister
var en oplagt brugergruppe til søgeprogrammer. De professionelle programmer har
prismæssigt desværre ligget uden for min rækkevidde, eller også har de været
udviklet til at køre på netværk og servere. Manglende mulighed for søgning på
danske bogstaver har også været et markant for ikke at sige umuligt problem.
For at skabe behovet for informationssøgning skulle vi åbenbart en omvej omkring
søgemaskinerne på internettet. Nu ved de fleste, hvad udtrykket at google står
for.
I stedet har jeg ligeså længe søgt at løse mine søgeproblemer ved brug af (relations)databaser,
hvor jeg udtrækker nøgleoplysninger fra det enkelte dokument og indtaster disse
i det relevante felt. Dette betyder desværre ekstra arbejde i form af
indtastning af et udtræk af dokumentets data, ligesom behovet for relevante
felter har det med at ændre sig over tid. Det ender med et behov for
fuldtekstsøgning. Så de mange databaser blev ved forsøget.
Hertil har der altid været det problem, at et søgeprogram i princippet skulle
kunne søge på alle filformater og ikke kun være begrænset til nogle få, hvortil
kommer et ikke uvæsentligt problemer med søgning på de danske bogstaver. Begge
dele var i mange år sammen med prisen en væsentlig forhindring for mig i at
kunne anskaffe et sådan program.
Mit Magellan program måtte jeg således stoppe med at bruge, da Windows afløste
DOS-styresystemet.
Situationen i 2004/2005
Som sagt med Microsofts indbygning af Indekseringstjenesten i Windows 2000
og XP lagde firmaet ligesom op til, at nu skulle andre firmaer udbyde dedikerede
søgeprogrammer. Indekseringstjenesten er et meget avanceret program, der i
princippet giver adgang til stort set alle faciliteter, der direkte eller
indirekte ligger gemt i en fil eller på harddisken.
Indekseringstjenesten er ikke særligt brugervenlig, men det kan for den erfarne
finde den berømte nål i en høstak, når man ellers får lært det knudrede
søgesprog.
Ikke mindst Googles planer om at udbyde et gratis søgeprogram til brugerens egen
computer satte gang i andre programudviklere. Googles søgeprogram virker i
princippet på samme måde, uanset om du søger på internettet eller din egen
computer.
Med et slangudtryk siger vi i dag at google i stedet for at søge eller finde.
Efter Google havde offentliggjort deres planer om et lokalt søgeprogram barslede
såvel Microsoft som Yahoo! også med løfter om at udvikle og tilbyde et gratis
søgeprogram til den lokale computer. For disse tre udbydere er det
karakteristisk, at de samtidig tilbyder søgemaskiner til internettet, og begge
dele er gratis delvist finansieret ved annoncer i søgeresultatet.
Situationen omkring midten af 2005 er, at der er en række søgeprogrammer, der
mod betaling eller gratis for brugeren kan installeres på vedkommendes egen
computer og/eller på netværk.
Indeksering af filformater
Det er af afgørende betydning, at et søgeprogram kan finde informationerne i
så mange forskellige filformater som muligt. Uagtet Word nok er det mest
udbredte filformat, så findes der faktuelt en del andre filformater i
edb-verdenen.
Hertil kommer gamle filformater fra DOS verdenens barndom. I sig selv er det et
problem at bevare adgangen til de gamle filformater for nutiden. Faktisk kræver
det ofte særlige programmer, der kan læse de gamle filformater. På dette punkt
springer nogle af programmerne over, hvor gærdet er lavest og nøjes med de mest
udbredte Word, html- og pdf-formater.
Søgeprogrammer tilknyttet internetsøgemaskiner:
Yahoo! Desktop Search (baseret på betalingsprogrammet X1)
MSN (Microsoft) Toolbar Suite
Google Desktop
Gratis søgeprogrammer:
Copernic Desktop Search
Ask Jeeves (beta)
Blinkx
HotBot Desktop
Betalingsprogrammer:
Wizetech Archivarius 3000 ($25-$40)
Enfish Professional ($200)
ISYS Desktop ($570)
dtSearch Desktop ($199)
diskMETA Pro ($98)
(Listen er hentet fra en rapport udgivet 20-04-2005 og skrevet af Tom Noda og
Shawn Helwig, University of Wisconsin-Madison (UWM): Benchmark Study of Destop
Search Tools, There’s More to Search than Google & Yahoo!, An Evaluation of 12
Leading Desktop Search Tools. Rapporten kan hentes på
www.uwebc.org/decisiontools.)
Herudover er jeg bekendt med flg. søgeprogram:
X1 fra X1 Technologies ($ 75) (www.x1.com) og som også er grundstammen i
søgeprogrammet fra Yahoo! Programmet har de samme programmører bag sig som Lotus Magellan.
Kilde: www.x1.com. Se særskilt anmeldelse.
Benchmark Study of Destop Search Tools
Ovennævnte rapport gennemgår som sagt 12 af de førende (mest udbredte)
søgeprogrammer og vurderer dem på en lang række kriterier med hovedgrupperne:
brugervenlighed, omfang og dybde af søgefaciliteter, nøjagtighed, effektivitet i
forhold til brugen af computeren, sikkerhed og egnethed til brug i netværk.
Sikkerhed og brugen i netværk er ikke uventet akilleshælen i de fleste
undersøgte programmer, efter som de primært henvender sig til den private
edb-bruger, hvor dette ikke er det store problem.
Rapporten udpeger programmet Copernic Desktop Search fra firmaet Copernic som
det suverænt bedste program ud fra de fire første kriterier. Da denne version af
programmet tilmed er gratis, har jeg valgt at afprøve dette på min egen
computer, og version 1.6 Beta (721) blev derfor installeret den 11-07-2005.
Anmeldelsen kan ses her.
Herudover har jeg også valgt at afprøve X1, som i den særlige version tilknyttet
Yahoo! Desktop Search kom ind som det andet bedste program. Det blev grundet
manglerne ved gratisudgaven af Copernic til en afprøvning af betalingsversionen
af X1 ud fra en formodning om, at gratisudgaverne formodentlig vil have mangler,
som jeg har svært ved at klare mig uden. Jeg installerede derfor prøveversion af
5.2.2 den 12-07-2005. Anmeldelsen kan ses her.