Torben Aastrups slægtshistorie

Startside Op Indhold Gæstebog Min slægtshistorie EDB Anetavlen Kilderne Tips og idéer Foreninger

 

 

 

 

X1 Desktop Search
 

horizontal rule

Resumé

 

I det efterfølgende beskriver jeg søgeprogrammet X1 Desktop Search, dets måde at fungere på, fordele og ulemper.


Om X1

Firmaet bag X1 er X1 Technologies, Inc., som på sin hjemmeside www.x1.com bl. a. fortæller flg. om sig selv:

Firmaets formål er ”As a company, X1's only reason for existing is to get you the information you want -- instantly! We're determined that X1 will locate your old files and email as fast as you can type. That's not just a slogan; we mean literally as fast as you can type.”

[Firmaets eksistensgrundlag er at give dig lynhurtig adgang til den information, som du har brug for. Firmaet er fast besluttet på, at X1 skal kunne finde gamle filer og e-mails så hurtigt, som man kan skrive søgeordet. Det er ikke blot et slogan, vi mener det bogstaveligt, så hurtigt som man kan skrive det.]

Det var en frustration, der var anledningen til udviklingen af X1, hvorfor skulle det være lettere at finde et dokument på internettet end på sin egen harddisk?

Programmet har rødder tilbage til Lotus Magellan, og ovennævnte frustration fik Bill Gross til i 2001 at få samlet så mange af de folk, som i 1987 var med til at udvikle Magellan, for at få lave et moderne søgeredskab, som kunne håndtere de enorme datamængder, som kendetegner nutidens computersystemer.

Oprindelig fik programmet navnet Find senere ændret til X1 Desktop Search.

Programmet blev af PC Magazine udnævnt som det bedste søgeprogram i 2004.

Firmaet har omkring 2004/2005 indledt et samarbejde med internetsøgemaskinen Yahoo!, som skal bruge grundkoden i X1 (ver. 1.2) i et søgeprogram, der tilbydes brugerne gratis. Programmet vil indeholde væsentlige dele af købeprogrammet og på den måde være en hård konkurrent til sig selv.

Beskrivelse af programmet og det idé

Efter installation af programmet (som kan downloades i en 15 dages gratis prøveversion) starter X1 med det samme op med at indeksere hele harddisken. Heldigvis kan man ændre på opsætningen og begrænse indekseringen helt ned på laveste folderniveau. Indekseringen omfatter traditionelle tekstdokumenter, regneark o. lign., e-mails med vedhæftede tekstfiler, billeder, musik- og videofiler. Bestemte mailprogrammers adressebøger kan også indekseres.

Indekseringen kan holdes ved lige løbende eller efter et bestemt skema.

En søgning kan begrænses til et af hovedområderne som eks. dokumenter, men man kan også søge på samtlige områder på en gang.

 

Ligeledes kan man søge på alle data i hvert enkelt dokument på en gang eller nøjes med søgning i et af de mange felter, som resultatlisten kan vise. Hvert felt kan på den måde påføres et filter eks. en dato, der begrænser mulige hits.

 

Til dette brug findes der endvidere forskellige standardsøgninger, men brugeren kan også selv konfigurere en søgningstype, ligesom man kan gemme konkrete søgeformularer til genbrug.

Resultatet af søgningen vises i en resultatliste med et antal oplysninger om den enkelte fil som navn, dato, størrelse o. s. v. Brugeren kan vælge blandt flere forskellige oplysninger som eks. Fra og Til i forbindelse med mails.

 

Peger man på en fil i listen, viser programmet i en viewer indholdet af den pågældende fil i sit originale format. Alternativt kan man klikke på filen og få den vist i moderprogrammet.

Man kan begrænse sin (tekst)søgning ved brug af logiske operatorer som AND, NOT, NEAR og PRE. Herudover er der et yderligere antal operatorer, men ikke flere end man kan huske. Eks. kan man søge på to ord under forudsætning af, at de befinder sig inden for et vist antal ord fra hinanden.

Ved søgning på en dato eks. 13-07-2005 slipper man for at anføre datoen i anførselstegn. Alle tegn oversættes til mellemrum, hvorved elementerne betragtes som en sammenhængende søgning.

Programmet opretter en fælles fil for den indekserede tekst placeret på harddisken efter brugerens eget valg. Ved den første indeksering af ca. 32.000 filer fyldte indeksfilen 126 Mbytes eller ca. 4 Kbytes pr. fil svarende til 20% af originalfilen. En absolut effektiv indekseringsmetode. Man opererer normalt med, at indeksfilen fylder omkring 25-50% af originalfilen.

Filformater

X1 kan indeksere og søge i en lang række filformater såvel under DOS som Windows og Macintosh, hvor Word, WordPerfect, Word Pro! txt, rtf, html og pdf (tilsyneladende ikke xml) hører til de mest kendte. Hertil kommer kendte regneark, databaser, grafik og præsentationsformater. Hvor flere filer er komprimeret sammen i en fil, indekseres filnavnet på den enkelte fil.

Selv oplyser firmaet, at X1 kan indeksere 370 forskellige filtyper.

Vigtigt er, at X1 kan indeksere og søge i eks. danske bogstaver (Unicode) og uden begrænsning. Dog har X1 det samme problem som Copernic med danske karakterer i mine bankudtog og lønsedler, hvor danske bogstaver delvist er oversat til de gamle ascii-tegn. Eftersom problemet går igen i to forskellige søgeprogammer, tyder det på, at der er tale om en systemfejl hos leverandøren af pdf-dokumenterne.

Fordele ved X1:

Ved en beskrivelse af fordele og ulemper har jeg taget udgangspunkt i henholdsvis Microsofts Indekseringstjeneste, version 1.5 beta fra Copernic og version 5.2.2.

En stor fordel er, at indholdet af den enkelte fils tekst/grafik kan vises i en intern viewer, herunder at man springer frem i teksten til den første forekomst af det eller de søgte ord. Såvel tekst som billeder kan vises i forskellige størrelser afpasset efter vinduet. Man kan ved at klippe på filen vælge at få vist denne i moderprogrammet på sædvanlig vis.

Man kan vælge hovedområde for søgningen eller søgning på alt. Der er altså fri valg for, hvor omfattende søgningen skal være. Herudover kan man bruge visse foruddefinerede søgeskabeloner, ligesom en konkret søgning kan gemmes til senere brug.

Man kan med den samme søgning springe rundt mellem de forskellige hovedområder, og resultatet vises med det samme.

Søgeresultatet kan sorteres i stigende og faldende alfanumerisk orden for hver felt, der vises i resultatlisten. Der kan sorteres på 3 felter i 1., 2. og 3. prioritet.

Man kan vælge at få vist flere forskellige felter som navn, fildato, oprettelsesdato, størrelse o. s. v. på resultatlisten. Mange af disse felter refererer til e-mails som Til, Fra og Emne.

Grafikfiler vises i en størrelse svarende til det aktuelle vindue.

Markerede filer i resultatlisten kan knyttes til en udgående e-mail og sendes via eget mailprogram.

Resultatlisten kan klippes/klistres over i et andet program eller eksporteres i forskellige formater eks. som en kommasepareret fil til brug i databaser eller regneark.

Resultatlisten vises ugrupperet og som en total liste over samtlige resultater. Ønskes en sortering efter foldernavn, vælges dette felt som kolonne og sorteres efterfølgende.

En søgning på en dato i formatet ÅÅÅÅ-MM-DD sker også på filens aktuelle dato. En søgning på et given årstal inden for Windows filområde giver dermed også alle filer med den aktuelle fildato.

Vedhæftede tekstfiler i mails indekseres også.

Foldernavne indekseres, hvilket giver mulighed for at begrænse en søgning til en given folder og dens underfoldere.

Søgesproget giver flere og overkommelige søgemuligheder som eks. A /15 B giver filer med A inden for en afstand af 15 ord fra B.

Programmets nøjagtighed i søgning svarer til Indekseringstjenesten. En søgning på RN0184 giver 6.801 hits i X1 og 6.803 i Indekseringstjenesten.

Mangler ved X1:

Programmet starter umiddelbart efter installationen op med at indeksere hele harddisken. Generelt foretrækker jeg som bruger i forbindelse med installationer af programmer altid at blive spurgt om forskellige installations/konfigurationsmuligheder.

Jeg savner muligheden for at vise felter med oplysninger fra filens egenskaber så som titel, emne, forfatter o. s. v. E-mails har i den foreliggende udgave denne mulighed, men andre filtyper bør også være tilgængelige på samme måde. For billeder bliver der med den øgede digitale fotografering et stigende behov for at kunne vise EXIF og andre metadata knyttet til en billedfil.

E-mail adresser kan kun indekseres, hvis man har programmet Outlook, og favoritter samt besøgte hjemmesideadresser kan ikke indekseres, som man ser det i Copernic.

RAW-billedformatet er endnu ikke tilgængeligt, men kommer formodentlig i forbindelse med, at Microsoft i Windows XP i et tillægsprogram nu har udviklet en viewer til dette billedformat.
 

 


13-07-2005 Torben Aastrup
 

Denne note er ajourført 18-07-2005

horizontal rule