Paieškos sistemos yra vienas svarbiausių šiuolaikinės informacinės visuomenės įrankių, leidžiančių vartotojams efektyviai orientuotis skaitmeninėje erdvėje. Paieškos sistemos apibrėžiamos kaip specializuota programinė įranga, skirta informacijos paieškai internete arba tam tikrose duomenų bazėse. Veikdamos kaip pagrindinis prieigos taškas prie informacijos, paieškos sistemos užtikrina galimybę ne tik rasti dokumentus ar tinklalapius, bet ir lokalizuoti įvairius skaitmeninius objektus – kontaktus, el. laiškus, užrašus, kalendoriaus įrašus ar programėles. Šių sistemų reikšmė peržengia tradicinio paieškos įrankio funkcijas: jos evoliucionavo į kompleksinius „atsakymų variklius“, gebančius pateikti struktūruotus duomenis, faktus ir semantiškai interpretuotus rezultatus, taip sukuriant galimybę ieškoti ne tik „simbolių sekų“, bet ir „reiškinių“. Tokiu būdu paieškos sistemos tampa ne tik techniniu, bet ir epistemologiniu įrankiu, transformuojančiu informacijos gavimo, apdorojimo bei naudojimo procesus.
Ankstyvios paieškos sistemos: (iki plačiai paplinant WWW)
Archie paieškos sistema (1990)
Verta paminėti, kad pats pirmasis įrankis, naudotas paieškai internete, buvo Archie, sukurtas 1990 metais. Jį galime vadinti paieškos varikliu, tačiau taip pat turime atskirti Archie nuo „interneto paieškos variklio“ („Web Search Engine“), nes Archie funkcionalumas buvo kitoks: jis atsisiųsdavo visų viešai prieinamų anoniminių FTP (Failų Perdavimo Protokolo) svetainių katalogų sąrašus, sukurdamas paieškos duomenų bazę iš failų pavadinimų. Jis neindeksuodavo šių svetainių turinio. Paprasčiau tariant, Archie buvo tarsi bibliotekininkas, kuris vedė tik visų fizinių failų (tokių kaip dokumentai ar programos), esančių tam tikruose viešuose duombazėse, pavadinimų sąrašą. Jei norėjote rasti failą apie „receptus“, Archie galėjo pasakyti, ar egzistuoja failas pavadinimu „receptai.txt“ ir kur jį rasti. Tačiau jis neturėjo jokio supratimo, kas yra „receptai.txt“ dokumento turinyje – jis negalėjo pasakyti, ar tai straipsnis apie sausainius, ar apie spagečius.

Archie paieškos įrankio veikimo principas: nuo paieškos iki atsisiuntimo
1. Prisijungimas prie Archie serverio ir užklausos pateikimas:
Jūs prisijungtumėte prie Archie serverio (dažniausiai per Telnet arba naudodami specialią Archie kliento programą). Įvestumėte paieškos užklausą, pavyzdžiui, prog search receptai. Tada Archie, remdamasis savo didele duomenų baze (kurią sudarydavo iš FTP katalogų sąrašų), pateiktų šią informaciją:
- Failo pavadinimą (pvz., receptai.txt)
- FTP serverį, kuriame failas yra (pvz., ftp.pavyzdys.com)
- Tikslų katalogo kelią tame serveryje (pvz., /pub/documents/gaminimas/)
2. Grįžimas prie FTP norint rasti ir atsisiųsti dokumentą:
Turėdami šią informaciją iš Archie, atsijungtumėte nuo Archie serverio. Atidarytumėte atskirą FTP kliento programą. Rankiniu būdu prisijungtumėte prie konkretaus FTP serverio, kurį nurodė Archie (pvz., ftp.pavyzdys.com). Prisijungę, pereitumėte per katalogų struktūrą iki tikslaus kelio, kurį pateikė Archie (pvz., cd /pub/documents/gaminimas/). Galiausiai, naudotumėte FTP komandą (pvz., get receptai.txt), kad atsisiųstumėte dokumentą į savo kompiuterį.
Taigi, Archie buvo grynai atradimo įrankis, skirtas rasti failų vietas didžiuliame FTP serverių tinkle, kuriame buvo laikoma dokumentai ir informacija. Jis suteikė „žemėlapį“ iki failų, kuriuos turėjote pasiekti patys.
Gopher paieškos sistema (1991)
Antrasis atsirado Gopher. Gopher atsiradimas paskatino dviejų naujų paieškos programų – Veronica (1991 m.) ir Jughead (1991 m.) – sukūrimą. Šios paieškos sistemos yra tarsi šeima (visos susijusios viena su kita, nes naudojo Gopher infrastruktūrą ir duomenų bazę).
Šias paieškos sistemas, kaip ir Archie, galima priskirti ankstyvųjų paieškos įrankių (paieškos sistemos iki Pasaulinio žiniatinklio (WWW), nes tuo metu internetas buvo ankstyvojoje stadijoje ir paieškos įrankiai informacijos neieškojo internete taip, kaip tai daroma dabar).
Šie įrankiai buvo veiksmingi atitinkamiems protokolams (FTP, Gopher), tačiau jie daugiausia indeksuodavo metaduomenis, tai yra, susirinkdavo iš duomenų bazių tokią informaciją kaip: failų pavadinimus, meniu pavadinimus. Visi šie įrankiai veikė hierarchinėse struktūrose, tai yra, katalogų/meniu medžio principu, nes informacija buvo organizuojama į griežtai apibrėžtus katalogus (kaip FTP serveryje) arba meniu punktus (kaip Gopher serveryje). Kiekvienas katalogas ar meniu galėjo turėti subkatalogų arba submeniu, sudarydamas, hierarchinę struktūrą.
Gopher paieškos įrankio veikimo principas:
- Kai pirmą kartą prisijungdavote prie Gopher serverio, pamatydavote pirmąjį meniu. Jis galėjo atrodyti maždaug taip:
--> 1. Apie šį Gopher serverį
2. Universitetinė informacija
3. Mokslinių tyrimų skyriai
4. Bibliotekos ištekliai
5. Viešieji failai ir atsisiuntimai
6. Pramogos ir hobiai
7. Pasaulio naujienos
8. Kiti Gopher serveriai
2. Navigacija į subkategoriją: Jūs pasirinktumėte 6 variantą „pramogos ir hobiai“. Tai nukreiptų jus į naują meniu:
--> 1. Filmai ir kinas
2. Muzikos kolekcijos
3. Žaidimai ir galvosūkiai
4. Receptai ir kulinarija
5. Kelionių vadovai
6. Pramogos ir hobiai
Dabar „Receptai ir kulinarija“ yra siauresnė kategorija, kuri atrodo perspektyvi.
3. Tolesnis skirstymas (artėjant prie tikslo): Jūs pasirinktumėte 4 variantą „Desertai ir kepiniai“. Tai galėtų nuvesti prie kito submenu:
--> 1. Užkandžiai
2. Pagrindiniai patiekalai (mėsa)
3. Pagrindiniai patiekalai (vegetariški)
4. Desertai ir kepiniai
5. Gėrimai
6. Tarptautinė virtuvė
4. Konkretaus elemento (failo/dokumento) pasiekimas: Pasirinkus 4 variantą „Desertai ir kepiniai“, galėtų būti parodytas faktinių receptų failų sąrašas:
--> 1. Obuolių pyrago receptas
2. Pyragėlių (Brownie) receptas
3. Šokoladinių sausainių receptas
4. Sūrio torto receptas
5. Rauginto starterio gidas
Pagaliau radote „Šokoladinių sausainių receptą“ (3 variantas). Tai yra norimo pasiekti failo pavadinimas (žyma). Tada pasirinktumėte jį, kad peržiūrėtumėte jo turinį.
Ankstyvosios paieškos sistemos neskaitė, kas yra „šokoldainių sausainių receptų.doc“ faile, kad sužinotų, ar tai tikrai apie sausainius. Jos tiesiog žinojo, kurioje „lentynoje“ ir kokiame „aplanke“ tas failas yra, remdamosi jo pavadinimu ir struktūra. Reikėjo patiems pasiekti tą vietą, kad gautumėte ir peržiūrėtumėte failo turinį.
Esminiai Archie ir Gopher skirtumai: Apimtis ir informacijos paieškos mechanizmai
Archie:
- Archie rinkdavo failų pavadinimus ir jų katalogus iš išorinių serverių, suteikdamas vartotojams failų vietą.
- Norint faktiškai pasiekti failą, rastą per Archie, vartotojas turėjo atsijungti nuo Archie serverio ir naudoti atskirą FTP, kad rankiniu būdu prisijungtų prie nurodyto serverio, atrastų ir atsisiųstų dokumentą pagal Archie nurodytą ,,kelią’’
- Analogas: Archie yra tarsi bibliotekininkas, kuris duoda jums knygos numerį ir nurodo patiems eiti jos ieškoti.
Gopher:
- Priešingai, Gopher buvo integruota protokolo sistema savaime, siūlanti savarankišką, meniu valdomą aplinką dokumentų organizavimui, naršymui ir paieškai.
- Kai vartotojas pasirinkdavo kokį elementą iš Gopher meniu, Gopher programa (naršyklė) iškart atidarydavo turinį arba pradėdavo siųstis failą. Ji netgi galėjo pati susijungti su kitomis sistemomis, pavyzdžiui, FTP, tau net nepastebint, nereikalaudama perjungti programų.
- Analogas: Gopher yra tarsi bibliotekininkas, kuris jums atnešą Jūsų pasrinktą knygą.
Veronica (1991)
1991 m. iškilusi „Veronica“ tapo esminiu paieškos įrankiu sparčiai plėtojančiame Gopher tinkle, siekdama padaryti šios hierarchinės informacijos struktūros turinį lengviau prieinamą. Skirtingai nei šiuolaikinės interneto paieškos sistemos, indeksuojančios dokumentų turinį, „Veronica“ veikė panašiai kaip „Archie“ FTP aplinkoje – daugiausia dėmesio buvo skiriama metaduomenims. Ji kūrė ir palaikė išsamų duomenų bazės indeksą, apimantį meniu pavadinimus ir failų pavadinimus iš didžiosios daugumos (daugiau nei 99 %) pasaulio „Gopher“ serverių, taip sudarydama globalų šio tinklo katalogų sąrašų indeksą.
Vartotojui inicijavus paiešką, sistema užklausdavo šią metaduomenimis paremtą bazę ir dinamiškai sugeneruodavo „vietoje sukurtą meniu“, kuriame patekdavo tik tie „Gopher“ elementai, kurių pavadinimai atitiko įvestus raktažodžius. Esminė naujovė buvo ta, kad rezultatai nebuvo statiškas sąrašas: „Veronica“ veikė tarsi pats „Gopher“, leisdamas vartotojui tiesiogiai sąveikauti su pateiktu meniu ir akimirksniu jungtis prie atrinktų šaltinių. Tai pavertė „Veronica“ galinga ir lanksčia informacjos atradimo sistema griežtai struktūruotoje „Gopher“ aplinkoje.
Pavyzdinis Veronica veikimo principas
Įsivaizduokime situaciją 1993 m., kai universiteto studentas ieško medžiagos savo kursiniam darbui apie kvantinę fiziką. Tuo metu didelė dalis akademinės informacijos buvo prieinama „Gopher“ tinkle, tačiau naršymas tarp atskirų serverių buvo sudėtingas ir imlus laikui. Čia išskirtinę reikšmę įgavo „Veronica“
1. Prisijungimas prie „Veronica“
Studentas atveria „Gopher“ naršyklę ir iš pagrindinio meniu pasirenka prieigą prie „Veronica“ serverio, kuris dažniausiai būdavo pateikiamas skyriuje „Kiti Gopher serveriai“ → „Paieškos įrankiai“. Ekrane pasirodo standartinė užklausos forma su tekstiniu laukeliu, kviečiančiu įvesti paieškos raktinius žodžius (pvz., „kvantinė fizika“).
2. Užklausos atlikimas
Į laukelį įvedami raktiniai žodžiai „kvantinė fizika“. Po to sistema pradeda paieškos procesą.
3. Vidinis „Veronica“ veikimo principas
Svarbu pabrėžti, kad „Veronica“ tuo metu neatlieka tiesioginio gyvo naršymo po „Gopher“ tinklą. Vietoje to ji naudoja savo anksčiau sukauptą ir centralizuotą duomenų bazę, kurioje indeksuoti meniu pavadinimai ir failų vardai iš beveik visų pasaulio „Gopher“ serverių. Tai leidžia greitai atrinkti tuos įrašus, kuriuose yra abu ieškomi terminai.
4. Dinamiškai sugeneruotas rezultato meniu
Po kelių akimirkų „Veronica“ pateikia naujai sugeneruotą, tik šiai paieškai skirtą „Gopher“ meniu. Jame matomi tik tie serverių įrašai, kurių pavadinimai atitiko užklausą. Pavyzdžiui:
--------------------------------------------------
| Veronica paieškos rezultatai: "kvantinė fizika"|
| |
| --> 1. Quantum Physics Research Group (Cambridge) |
| 2. Introduction to Quantum Physics (MIT) |
| 3. Lecture Series: Quantum Theory (Caltech) |
| 4. Quantum Mechanics Papers (FNAL FTP Archive) |
| 5. Graduate Seminars in Quantum Optics (Stanford)|
--------------------------------------------------
5. Sąveika su rezultatais
Šiame etape vartotojas naršo rezultatų meniu taip pat, kaip naršytų bet kurį kitą „Gopher“ meniu. Pasirinkęs, pavyzdžiui, „Introduction to Quantum Physics (MIT)“, jis automatiškai perkeliamas į MIT „Gopher“ serverį, kuriame atsisiunčiamas ir atveriamas tekstinis failas su kursų užrašais.
Naršymas „Gopher“ tinkle be ir su „Veronica“
Prisijungus tiesiogiai prie vieno „Gopher“ serverio, vartotojas iš esmės patekdavo tik į tą konkretų „archyvą“ ar „biblioteką“. Buvo galima naršyti meniu bei turinį, tačiau kiekvienas serveris egzistavo kaip atskira erdvė. Norint susipažinti su kito serverio informacija, reikėdavo atsijungti nuo esamo ir rankiniu būdu prisijungti prie naujo serverio. Toks procesas apsunkino prieigą prie platesnių informacijos išteklių ir reikalavo daugiau techninių veiksmų iš vartotojo.
Situacija radikaliai pasikeitė atsiradus „Veronica“. Šiuo atveju vartotojas jungdavosi ne prie vieno konkretaus serverio, o prie paieškos variklio, kuris jau buvo sukaupęs didžiulę centralizuotą duomenų bazę. Ji buvo sudaryta iš meniu pavadinimų ir failų vardų, surinktų iš beveik visų pasaulio „Gopher“ serverių. Atlikęs paiešką, vartotojas nebeapribodavo savęs vieno serverio turiniu, bet užklausdavo visą „Gopher“ tinklą vienoje vietoje. Tokia centralizuota prieiga pavertė „Veronica“ esminiu informacijos atradimo įrankiu.
Perėjimas prie WWW paieškos sistemų
Pasaulinio žiniatinklio arba paprasčiau interneto asponentiškas augimas sukėlė naują iššūkį: kadangi jis buvo nehierarchiškas (preišingai negu mūsų aptartos pirmosios paieškos sitemos,nes kiekvienas tinklalapis galėjo turėti nuorodų į bet kurį kitą tinklalapį, nebesilaikant jokių griežtų kategorijų ir sudarytas iš tarpusavyje susietų nuorodų, paprastos meniu sistemos ar failų sąrašai nebebuvo tinkami. Kai serverių daugėjo, centrinis sąrašas nebespėjo visko susekti. Todėl reikėjo kurti naujas technologijas.
W3Catalog: pirmasis primityvus WWW paieškos variklis
1993 m. rugsėjo 2 d. diena žymi svarbų įvykį – pasirodė W3Catalog, laikomas pirmuoju primityviu WWW paieškos varikliu. Jį sukūrė Oscaras Nierstraszas Ženevos universitete.