I det efterfølgende beskriver jeg søgeprogrammet X1 Desktop
Search, dets måde at fungere på, fordele og ulemper.
Om X1
Firmaet bag X1 er X1 Technologies, Inc., som på sin hjemmeside
www.x1.com bl. a.
fortæller flg. om sig selv:
Firmaets formål er ”As a company, X1's only reason for existing is to get you
the information you want -- instantly! We're determined that X1 will locate your
old files and email as fast as you can type. That's not just a slogan; we mean
literally as fast as you can type.”
[Firmaets eksistensgrundlag er at give dig lynhurtig adgang til den information,
som du har brug for. Firmaet er fast besluttet på, at X1 skal kunne finde gamle
filer og e-mails så hurtigt, som man kan skrive søgeordet. Det er ikke blot et
slogan, vi mener det bogstaveligt, så hurtigt som man kan skrive det.]
Det var en frustration, der var anledningen til udviklingen af X1, hvorfor
skulle det være lettere at finde et dokument på internettet end på sin egen
harddisk?
Programmet har rødder tilbage til Lotus Magellan, og ovennævnte frustration fik
Bill Gross til i 2001 at få samlet så mange af de folk, som i 1987 var med til
at udvikle Magellan, for at få lave et moderne søgeredskab, som kunne håndtere
de enorme datamængder, som kendetegner nutidens computersystemer.
Oprindelig fik programmet navnet Find senere ændret til X1 Desktop Search.
Programmet blev af PC Magazine udnævnt som det bedste søgeprogram i 2004.
Firmaet har omkring 2004/2005 indledt et samarbejde med internetsøgemaskinen
Yahoo!, som skal bruge grundkoden i X1 (ver. 1.2) i et søgeprogram, der tilbydes
brugerne gratis. Programmet vil indeholde væsentlige dele af købeprogrammet og
på den måde være en hård konkurrent til sig selv.
Beskrivelse af programmet og det idé
Efter installation af programmet (som kan downloades i en 15 dages gratis
prøveversion) starter X1 med det samme op med at indeksere hele harddisken.
Heldigvis kan man ændre på opsætningen og begrænse indekseringen helt ned på
laveste folderniveau. Indekseringen omfatter traditionelle tekstdokumenter,
regneark o. lign., e-mails med vedhæftede tekstfiler, billeder, musik- og
videofiler. Bestemte mailprogrammers adressebøger kan også indekseres.
Indekseringen kan holdes ved lige løbende eller efter et bestemt skema.
En søgning kan begrænses til et af hovedområderne som eks. dokumenter, men man
kan også søge på samtlige områder på en gang.
Ligeledes kan man søge på alle data i hvert enkelt dokument på en gang eller
nøjes med søgning i et af de mange felter, som resultatlisten kan vise. Hvert
felt kan på den måde påføres et filter eks. en dato, der begrænser mulige hits.
Til dette brug findes der endvidere forskellige
standardsøgninger, men brugeren kan også selv konfigurere en søgningstype,
ligesom man kan gemme konkrete søgeformularer til genbrug.
Resultatet af søgningen vises i en resultatliste med et antal oplysninger om den
enkelte fil som navn, dato, størrelse o. s. v. Brugeren kan vælge blandt flere
forskellige oplysninger som eks. Fra og Til i forbindelse med mails.
Peger man
på en fil i listen, viser programmet i en viewer indholdet af den pågældende fil
i sit originale format. Alternativt kan man klikke på filen og få den vist i
moderprogrammet.
Man kan begrænse sin (tekst)søgning ved brug af logiske operatorer som AND, NOT,
NEAR og PRE. Herudover er der et yderligere antal operatorer, men ikke flere end
man kan huske. Eks. kan man søge på to ord under forudsætning af, at de befinder
sig inden for et vist antal ord fra hinanden.
Ved søgning på en dato eks. 13-07-2005 slipper man for at anføre datoen i
anførselstegn. Alle tegn oversættes til mellemrum, hvorved elementerne betragtes
som en sammenhængende søgning.
Programmet opretter en fælles fil for den indekserede tekst placeret på
harddisken efter brugerens eget valg. Ved den første indeksering af ca. 32.000
filer fyldte indeksfilen 126 Mbytes eller ca. 4 Kbytes pr. fil svarende til 20%
af originalfilen. En absolut effektiv indekseringsmetode. Man opererer normalt
med, at indeksfilen fylder omkring 25-50% af originalfilen.
Filformater
X1 kan indeksere og søge i en lang række filformater såvel under DOS som Windows
og Macintosh, hvor Word, WordPerfect, Word Pro! txt, rtf, html og pdf
(tilsyneladende ikke xml) hører til de mest kendte. Hertil kommer kendte
regneark, databaser, grafik og præsentationsformater. Hvor flere filer er
komprimeret sammen i en fil, indekseres filnavnet på den enkelte fil.
Selv oplyser firmaet, at X1 kan indeksere 370 forskellige filtyper.
Vigtigt er, at X1 kan indeksere og søge i eks. danske bogstaver (Unicode) og
uden begrænsning. Dog har X1 det samme problem som Copernic med danske
karakterer i mine bankudtog og lønsedler, hvor danske bogstaver delvist er
oversat til de gamle ascii-tegn. Eftersom problemet går igen i to forskellige
søgeprogammer, tyder det på, at der er tale om en systemfejl hos leverandøren af
pdf-dokumenterne.
Fordele ved X1:
Ved en beskrivelse af fordele og ulemper har jeg taget udgangspunkt i
henholdsvis Microsofts Indekseringstjeneste, version 1.5 beta fra Copernic og
version 5.2.2.
En stor fordel er, at indholdet af den enkelte fils tekst/grafik kan vises i en
intern viewer, herunder at man springer frem i teksten til den første forekomst
af det eller de søgte ord. Såvel tekst som billeder kan vises i forskellige
størrelser afpasset efter vinduet. Man kan ved at klippe på filen vælge at få
vist denne i moderprogrammet på sædvanlig vis.
Man kan vælge hovedområde for søgningen eller søgning på alt. Der er altså fri
valg for, hvor omfattende søgningen skal være. Herudover kan man bruge visse
foruddefinerede søgeskabeloner, ligesom en konkret søgning kan gemmes til senere
brug.
Man kan med den samme søgning springe rundt mellem de forskellige hovedområder,
og resultatet vises med det samme.
Søgeresultatet kan sorteres i stigende og faldende alfanumerisk orden for hver
felt, der vises i resultatlisten. Der kan sorteres på 3 felter i 1., 2. og 3.
prioritet.
Man kan vælge at få vist flere forskellige felter som navn, fildato,
oprettelsesdato, størrelse o. s. v. på resultatlisten. Mange af disse felter
refererer til e-mails som Til, Fra og Emne.
Grafikfiler vises i en størrelse svarende til det aktuelle vindue.
Markerede filer i resultatlisten kan knyttes til en udgående e-mail og sendes
via eget mailprogram.
Resultatlisten kan klippes/klistres over i et andet program eller eksporteres i
forskellige formater eks. som en kommasepareret fil til brug i databaser eller
regneark.
Resultatlisten vises ugrupperet og som en total liste over samtlige resultater.
Ønskes en sortering efter foldernavn, vælges dette felt som kolonne og sorteres
efterfølgende.
En søgning på en dato i formatet ÅÅÅÅ-MM-DD sker også på filens aktuelle dato.
En søgning på et given årstal inden for Windows filområde giver dermed også alle
filer med den aktuelle fildato.
Vedhæftede tekstfiler i mails indekseres også.
Foldernavne indekseres, hvilket giver mulighed for at begrænse en søgning til en
given folder og dens underfoldere.
Søgesproget giver flere og overkommelige søgemuligheder som eks. A /15 B giver
filer med A inden for en afstand af 15 ord fra B.
Programmets nøjagtighed i søgning svarer til Indekseringstjenesten. En søgning
på RN0184 giver 6.801 hits i X1 og 6.803 i Indekseringstjenesten.
Mangler ved X1:
Programmet starter umiddelbart efter installationen op med at indeksere hele
harddisken. Generelt foretrækker jeg som bruger i forbindelse med installationer
af programmer altid at blive spurgt om forskellige
installations/konfigurationsmuligheder.
Jeg savner muligheden for at vise felter med oplysninger fra filens egenskaber
så som titel, emne, forfatter o. s. v. E-mails har i den foreliggende udgave
denne mulighed, men andre filtyper bør også være tilgængelige på samme måde. For
billeder bliver der med den øgede digitale fotografering et stigende behov for
at kunne vise EXIF og andre metadata knyttet til en billedfil.
E-mail adresser kan kun indekseres, hvis man har programmet Outlook, og
favoritter samt besøgte hjemmesideadresser kan ikke indekseres, som man ser det
i Copernic.
RAW-billedformatet er endnu ikke tilgængeligt, men kommer formodentlig i
forbindelse med, at Microsoft i Windows XP i et tillægsprogram nu har udviklet
en viewer til dette billedformat.