Agenttien arviointi
Agentteja kokeiltaessa on kiinnitetty huomiota (myöskin agentin tehtävästä riippuen) seuraaviin seikkoihin:
- millä perusteilla agentti tarjoaa tiettyjä sivuja/tietoja, mihin dokumentin kenttiin agentti kiinnittää huomiota etsiessään tietoa
- suomenkielisten hakujen onnistuminen
- henkilöhakujen onnistuminen
- kuinka osuvia tulokset ovat, paljonko tuloksia saadaan
- käytön helppous ja nopeus
SiteSeer
SiteSeer käy läpi käyttäjän antaman bookmarkin. Bookmarkin on hyvä olla jaettu aiheittain "kansioihin", jotta agentin on helpompi löytää eri aihealueen linkit. Linkkien perusteella SiteSeer etsii toisia käyttäjiä, joiden bookmarkista löytyy samanlaisia linkkejä. SiteSeer ei siis käy läpi itse dokumentteja, eikä hae niistä esimerkiksi hakusanoja, joita etsisi toisten käyttäjien bookmarkista löytyvistä linkeistä. SiteSeer käy läpi vain URL:t bookmarkeista, ja etsi täsmälleen samoja URL:ja, ja tarjoaa linkkejä, joita löytyy toisten käyttäjien, vastaavia URL:ja sisältävistä bookmarkeista. SiteSeer oppii sitä mukaa kun käyttäjiä, ja näin myös bookmarkeja, tulee lisää. Kansioihin ryhmitellyt linkit muodostavat agentin "tietämyksen", jonka perusteella agentti suosittelee käyttäjälle henkilökohtaisesti linkkejä. [25.] Pelkkään URL:ien etsimiseen ja täsmäyttämiseen, ja samaan klusteriin kuuluvien linkkien palauttaminen tulosjoukkona ei välttämättä vaadi kovin kehittynyttä agenttien kommunikointitapaa. Siinä mielessä SiteSeeriä voi ajatella älykkäänä agenttina, että se muodostaa koko ajan tietämyskantaa bookmark -listojen perusteella, mutta muunlaista "älykkyyttä" siitä on vaikea löytää.
Plussat - Yksinkertainen käyttää, ei tarvitse asentaa ohjelmistoa omalle koneelle.
- Nopea, silloin kun aiheesta löytyy linkkejä.
- Tulokset ovat aika osuvia, joskin heijastavat muiden käyttäjien maantieteellistä asemaa, eli ne ovat pääosin yhdysvaltalaista aineistoa. Tulosjoukko voi jäädä suppeaksi, mutta yleensä joukossa ei ole paljon epärelevantteja dokumentteja.
- Kehittyy jatkuvasti.
Miinukset - Löydettyjen linkkien määrä ja laatu riippuu muiden käyttäjien määrästä ja mielenkiinnon kohteista, spesifeihin ja moniin yleisempiinkin aiheisiin on vielä vaikea saada hyviä tuloksia.
- Agentti ei tutki itse dokumentteja millään tavalla, esimerkiksi poistettujen tai siirrettyjen dokumenttien URL:t ovat hyödyttömiä.
- Haut suomenkielisten dokumenttien linkkilistoilla tuottavat tulosta vasta kun käyttäjien joukossa on tarpeeksi muitakin samoja URL:ja listanneita käyttäjiä, eikä ainakaan vielä muita suomalaisia ollut niin paljon, että tuloksia olisi saanut. Pelkkiä henkilöhakuja agentilla ei voi tehdä.
- Jos käyttäjät eivät jaottele bookmark -listojansa aihepiireittäin, agentin käyttämä tietämyskanta ei voi muodostaa järkeviä ryhmiä samanaiheisista listoista. Liian pitkät ja moniaiheiset bookmark -listat eivät tuota tuloksia.
- Help -valintaa ei ole.
Firefly
Firefly on agentti, joka muodostaa käyttäjästä profiilin käyttäjän valintojen mukaan, ja hakee kaikkien käyttäjien muodostamasta tietokannasta henkilöitä, joilla on vastaavia mieltymyksiä. Tätä kutsutaan henkilökohtaisten profiilien yhteensovittamiseksi (collaborative filtering). [27.] Jokaisella käyttäjällä on henkilökohtainen Firefly Passport, joka sisältää käyttäjän profiilin. Käyttäjä voi muokata omaa Passportiaan. Firefly -agentti siirtyy käyttäjän mukana eri markkinapaikoille (tietyt palvelimet, mm. Filmfinder, Yahoo, Bignote) ja tekee suosituksia kaupallisista tuotteista (esim. kirjoista, ohjelmista tai musiikista) tai WWW -sivuista.
Firefly on tehty sosiaaliseksi tiedonhankintaympäristöksi. Toisten käyttäjien kanssa voi kommunikoida, ja se koetaan olennaiseksi tiedonhakua auttavaksi piirteeksi. Käyttäjä voi valita joitain toisia käyttäjiä, joiden mieltymyksistä hän voi saada tietoa ja näin vinkkejä omaan tiedonhakuunsa. Venues -vaihtoehto pitää sisällään useita keskusteluryhmiä, joiden aiheet on määritelty. Käyttäjä voi luoda myös oman keskusteluryhmänsä.
Firefly muodostaa tietämyskantaa, profiilia kustakin käyttäjästä, ja muotoilee sitä jatkuvasti käyttäjän preferenssien mukaan. Tämän voi nähdä olevan jonkinlaista oppimista. Tietämyskantaa päivittävät jatkuvasti myös tiedot toisten käyttäjien profiileista ja niiden muutoksista. Agentti saa siis jatkuvasti uutta tietoa, ja uusia viitteitä, joita se voi tarjota käyttäjälle hänen profiilinsa mukaan. Palvelu painottuu selvästi viihteeseen, ja sosiaaliseen kanssakäymiseen, ja voi olla hauska ajanviettotapa. Ammattimaiseen tiedonhakuun siinä on kuitenkin "turhaa", eikä tiedonhaku ole perusteellista ja nopeaa.
Plussat - Käyttöliittymä on monipuolinen, ja profilointi onnistuu hyvin.
- Toisten ihmisten mieltymysten perusteella löytyy aika hyvin uusia, itseä kiinnostavia aiheita ja sivuja.
- Palvelua kehitetään jatkuvasti.
Miinukset - Tiedonhaku on ainakin aluksi, profiilia muodostettaessa hidasta. Pitkäaikaisemmassa käytössä toiminta voi olla tehokkaampaa ja tulokset parempia.
- Firefly voi tuntua hitaalta tai monimutkaiselta käyttää monien vaihtoehtojen takia.
- Agentin tiedonhaun lähteet ovat hyvin rajoitetut, vain muutamaan palvelimeen. Tarkoitus on laajentaa "Firefly Passportin" käyttöä muihinkin palvelimiin.
- Suomalaista musiikkia tai elokuvia ei juurikaan löydä, ja nimet on syytä kirjoittaa ilman skandeja (esim. Kaurismaki).
Go-Get-It
Go-Get-It -agentista on useita evaluointiversioita eri palvelimilla, ja nämä eroavat hiukan toisistaan. Tässä on käytetty versiota ggi2.zip. Agentti lähtee hakemaan dokumentteja aina samasta pisteestä, joka on AltaVistan hakupalvelu. Nopeasti agentti käy läpi muitakin palveluja. Agentille ei voi itse määritellä palvelinta, josta se aloittaa dokumenttien etsimisen. Jos agentti ei jostain syystä pääse hakemaan jotain dokumenttia, se ilmoittaa mikä on vikana. Syynä on monesti se, että agentti hakee nopeasti, eikä jää odottelemaan jos jonkun sivun lataaminen on hidasta. Go-Get-It löytää suomalaisiakin dokumentteja. Löydetyistä dokumenteista hakusanat on korostettu eri värillä. Agentti hakee sivut ilman kuvia, mutta haluttaessa voi hakea myös dokumenttien kuvat. Agentti tallentaa sivut omalle koneelle käyttäjän halutessa, ja sen voi neuvoa tarkkailemaan mahdollisia muutoksia haluamillaan sivuilla. Jonkun tallennetun sivun muututtua agentti päivittää sivun myös omalle koneelle. Go-Get-It on selkeästi liikkuva agentti, ja jossain määrin autonominenkin. Koska se ei kuitenkaan opi, ja hakee dokumentteja puhtaasti täsmäyttämällä annettuja hakusanoja, se ei ole älykäs agentti, jos termi ymmärretään kapeasti.
Plussat - Nopea.
- Käyttöliittymä on yksinkertainen ja selkeä.
- Dokumentteja voi katsella omalta koneelta ja säästää yhteysajassa, sekä välttyä esim. verkon hitaudelta.
- Tulokset vastaavat hakua hyvin.
Miinukset - Hakukoneiden tulokset vaikuttavat siihen, millaisia tuloksia agentti tuo.
- Agentille ei voi antaa palautetta tuloksista, eikä se opi.
- Haun tulokset ovat riippuvaisia siitä, mitä hakusanoja käyttäjä osaa aiheestaan kertoa.
EchoSearch
EchoSearch -ohjelma haetaan omalle koneelle. Ohjelma on ns. metahakukone, joka käyttää hyväkseen muita hakukoneita. EchoSearchille annetaan hakusanat tyhjillä väleillä erotettuna, halutessaan voi tehdä edistyneen (advanced) haun, joka tarkoittaa mahdollisuutta lisätä sanoja, joiden tulee/ei tule esiintyä haetuissa dokumenteissa, tai painottaa jotain hakusanoja. Tekemäänsä hakua voi muotoilla uudelleen, ja haettavien dokumenttien määrän voi määritellä itse, samoin hakukoneet, joista haku tehdään. EchoSearch hakee viitteitä joko WWW- tai Usenet-dokumentteihin, ja joko hakukoneiden tai käyttäjän määrittelemien bookmarkien perusteella. EchoSearch järjestää viitteet aakkosjärjestykseen, tai käsitteiden perusteella ja hakee ne käyttäjän koneelle. Käyttäjä voi säästää yhteysaikaa katsellessaan dokumentteja omalta kovalevyltään, ja valitessaan vasta ne nähtyään sivut joita haluaa tarkastella syvemmin itse palvelimelta. EchoSearch käy läpi löydetyt dokumentit, tallentaa ne omalle koneelle, ja käyttäen NLP:a listaa ne sen mukaan relevanssijärjestykseen, ei siis pelkän sanafrekvenssin mukaan.
Plussat - Nopea
- Dokumentteja voi katsella omalta koneeltaan ja näin säästyä verkon hitaudelta ja raskailta kuvilta
- Dokumenttien etsinnän kriteereitä ja näyttöä voi muotoilla
- EchoSearch voi esittää tulokset monella tapaa
Miinukset - Tulosjoukon dokumenteista monet ovat saman palvelimen läheisiä dokumentteja, ja näin tulosjoukko on hyvin epätasaisesti painottunut.
- Voi tehdä muun työn tietokoneella hitaaksi.
- Agentilla on aina oletusarvot esimerksiksi hakukoneiden valinnassa, ne on joka kerta ohjelma avattaessa määriteltävä uudelleen haluamansalaiseksi.
- Sama hakulause ei toimi yhtä hyvin kaikissa hakukoneissa.
- Verkko kuormittuu tällaisista ohjelmista, jotka pommittavat nopeasti yhtäaikaa useita hakukoneita.
- EchoSearch on täysin riippuvainen hakukoneiden indeksoinnista, hakumahdollisuuksista ja tulosten esittämisjärjestyksestä. Se ei löydä dokumentteja, joita ei löydy hakukoneiden tietokannoista.
EchoSearchin tapainen metahakukone voi nopeuttaa ja helpottaa tiedonhakua, jos yksittäinen hakukone ei riitä tuomaan hyviä tuloksia. Toisaalta se ei voi itse hakuprosessiin tuoda älykkyyttä sen enempää kuin hakukoneissa itsessään on. EchoSearchia ei mainostetakaan älykkäänä agenttina. Oikeastaan ainoa piirre, joka voisi oikeuttaa kutsumaan EchoSearchia älykkääksi agentiksi, on luonnollisen kielen prosessoinnin (NLP) käyttö dokumenttien järjestyksen määrittelyssä. Tämä ei kuitenkaan näy poikkeuksellisen hyvänä tulosjoukon järjestyksenä. Tiivistelmät sivuista ovat sivulta suoraan poimittuja lauseita. EchoSearch voi esittää tulokset monella tavalla, käyttäjän toiveen mukaan. EchoSearch -hauissa voi käyttää siis, kuten hakukoneiden hauissakin, suomenkielisiä hakuja ja henkilöhakuja. Kehittyneitä hakukoneiden piirteitä EchoSearch ei voi kuitenkaan hyödyntää, koska ne eroavat niin paljon eri hakukoneiden välillä.
javElink
javElink on agentti, joka kertoo käyttäjälle hänen antamastaan URL -listasta sivut, jotka ovat muuttuneet. Käyttäjä lisää listaan sivuja, agentti tallentaa sivun koodin, ja muodostaa dokumentista tiivistelmän. Käyttäjä voi ladata myös oman bookmarkinsa agentin tarkistuslistaksi, siitä on kuitenkin erikseen merkittävä dokumentit, joita agentin tulee tarkkailla. Score -numerotunnus kertoo sivun "muuttuvuuden", suuri luku kertoo että sivu on muuttunut useita kertoja lyhyen ajan sisällä, pieni luku taas että muutoksia on ollut vähän tai ei ollenkaan. Jos sivun otsikon kohdalla on pieni värikäs sivun kuva, sivu on muuttunut edellisen tarkistuskerran jälkeen. Klikkaamalla sivun kuvaa agentti näyttää värein, mitkä kohdat sivusta ovat muuttuneet. Eri värit kuvaavat eri muutoksia; mitä on muutettu viimeisimmän tarkistuskerran jälkeen, sitä ennen tai poistettu sivulta. Agentti näyttää kuvakkeella, jos sivu on väliaikaisesti tavoittamattomissa, tai sivua ei ole ollenkaan.
Plussat - Näyttää dokumenteista kohdat jotka ovat muuttuneet, ja kertoo mitä muutoksia on tapahtunut
- Käyttöliittymä helppo ja selkeä, liikkuminen nopeaa
- Käyttöohjeet yksinkertaiset ja kattavat
Miinukset - Ilmoitukset muutoksista täytyy käydä erikseen tarkastamassa palvelusta, niistä ei voi saada esimerkiksi sähköpostiviestissä
- Ei monitoroi sivuja, jotka vaativat käyttäjätunnuksen ja salasanan
- Toimii vain http -protokollan kanssa, esim. gopher- tai ftp- sivujen tarkkailu ei onnistu
- Jos sivulla on framet eli kehykset, javElinkiltä voi jäädä huomaamatta muutokset jonkin kehyksen sisällä
- Ei ole hyödyksi tiedonhaussa, ylläpidossa kylläkin
WBI
WBI suorittaa seuraavia toimintoja:
- HISTORY; Historia -painike näyttää selailuhistorian, eli kaikki sivut joita käyttäjä on selaillut . Sivujen järjestys muodostuu sen perusteella kuinka usein, ja kuinka äskettäin käyttäjä on sivulla vieraillut. Jokaisen linkin vieressä on tätä kuvaava numero. Historia -näytössä voi myös etsiä sanahaulla tiettyä dokumenttia omasta historia -listastaan. Haun voi kohdistaa koko kenttään, title -kenttään, tai URL:iin.
- PATH; Path -toiminto näyttää reitin, jota käyttäjä on kulkenut selaillessaan. Se näyttää mitä käyttäjä on tehnyt ollessaan samalla sivulla viimeksi. Eli ollessaan samalla sivulla kuin joskus aiemminkin, path näyttää reitin, jota käyttäjä kulki ko. sivulta.
- WATCH; Agentille voi kertoa sivut, joita sen haluaa tarkkailevan mahdollisten muutosten varalta. Kun jokin käyttäjän määrittelemistä sivuista on muuttunut, tulee WBI -otsikkokenttään ilmoitus "Look here", ja sitä klikkaamalla näkee sivut, joissa muutoksia on tapahtunut.
- LOOK; Look -toiminto on siis edellä mainittu, Watch -toiminnosta seuraava mahdollisuus nähdä muuttuneiden sivujen linkit.
- LINKKIEN NOPEUS; WBI:n ollessa auki taustalla, kaikkien dokumentissa olevien linkkien kohdalle tulee väripalkki, joka kertoo linkin arvioidusta nopeudesta. Pieni vihreä palkki kertoo nopeasta linkistä, korkeampi keltainen merkitsee hitaampaa, ja korkea punainen tarkoittaa että linkki ei joko vastaa, tai sivua ei löydy kyseisestä URL:sta.
WBI:n idea perustuu siihen, että käyttäjä löytää hyviä kulkureittejä, ja haluaa kulkea samoja reittejä uudelleenkin. Toisinaan näin tietysti on, ja on hyvä löytää jostain reitti jota on aiemmin kulkenut. Mutta saman avun vailla muutamia hienouksia voi saada selaimen history -listasta, ja vähemmällä vaivalla. WBI pyrkii kuitenkin kehittämään listaa sivuista sen mukaan, kuinka usein käyttäjä sivuilla vierailee. Linkkien toimivuudesta ja nopeudesta on mukava tietää, mutta väreihin ei kannata luottaa liiaksi, toimimattomaksi merkitty linkki onkin vain usein hitaanlainen. Älykkääksi agentiksi WBI:tä ei voi sanoa, sen toiminnot ovat mekaanisia, eikä se opi, tai suorita päättelyä. WBI on suhteellisen helppokäyttöinen, mutta saatu hyöty ei ole kovin suuri. WBI on lyhennelmä sanoista Web Browser Intelligence, mutta tekoälyn mukaista älykkkyyttä ohjelmassa ole.
Plussat - Yksinkertainen periaatteeltaan (toisaalta myös miinus)
- Ei hidasta paljon muita töitä tietokoneella
Miinukset - WBI:tä käytetään proxy -palvelimena, ja asetuksia täytyy muuttaa aina kun alkaa tai lopettaa WBI:n käytön, muuten voi esiintyä ongelmia
- Punaisella merkity linkit toimivat yleensä, joskin hitaammin
- Aluksi käyttö voi tuntua hiukan epäselvältä
Autonomy
Autonomya voi sanoa jo jonkintasoiseksi älykkääksi agentiksi. Siinä on useita ns. älykkyydeksi määriteltyjä piirteitä, kuten luonnollisen kielen hakulauseen perusteella dokumenttien hakeminen, oppiminen käyttäjän antaman palautteen perusteella ja liikkuminen autonomisesti verkossa. Käyttöliittymä on tehty mahdollisimman hauskaksi, käyttäjä nimeää koiran, jota hän "treenaa" tiedonhakuun kuvailemalla lauseilla kiinnostuksen kohdettaan, ja sitä, mistä ei kyseisen aiheen yhteydessä ole kiinnostunut (advanced search). Agentti oppii Cambridgen Neurodynamics:n kehittämän neuroverkkosovelluksen kautta. Käyttäjän antama palaute muodostaa mallin, jonka mukaan agentin hakuperusteet muuttuvat. Palautetta voi antaa joko suoraan, valitsemalla esimerkkidokumentin agentin jo löytämien perusteella, tai epäsuoraan Agentti käyttää neuroverkkoa myös mallintunnistukseen (pattern recognition) tarkastelemalla hakulausetta, etsimällä siitä avaintermejä, ja määrittelemällä niiden relevanssin haun kannalta. Agentin kerrotaan soveltavan myös sumeaa logiikkaa päättelyssään dokumenttien relevanssista. Agentti ei siis hae pelkästään avainsanojen perusteella, vaan etsimällä dokumentteja käsitteiden perusteella. Sumean logiikan avulla se voi päätellä, mitkä termit ovat läheisiä tai vastavat toisiaan. Löydettyään dokumentin, jonka se arvioi vastaavan käyttäjän toivomuksia, agentti käy läpi myös ko. dokumentin linkkejä löytääkseen lisää vastaavanlaisia dokumentteja. [3.] Agentin voi lähettää hakemaan myös kuvia. Autonomy lähtee yleensä hakemaan AltaVistasta, ja liikkuu nopeasti palvelimelta toiselle. Joutuessaan umpikujaan se palaa AltaVistaan, ja lähtee seuraamaan uutta reittiä. [1.] Henkilöhaut ja suomenkieliset haut onnistuvat kyllä agentilla, mutta niiden, kuin muidenkin "vaikeiden aiheiden" haut voivat kestää kauan aikaa, ennenkuin joukosta alkaa löytyä sopivia dokumentteja.
Plussat - Monipuolinen ja helppokäyttöinen
- Paranee mitä enemmän ja pitempään käytetään
- Agenttien tietojen vaihtaminen toisten käyttäjien kanssa
- Myös kuvahaut
- Noudattaa robot.txt -tiedostoihin kirjoitettuja tietoja (esim. tietyille palvelimille tai sivuille ei haluta robotteja/agentteja)
- Informoi käyttäjää koko ajan, mitä on löytynyt ja missä palvelimissa agentti on käynyt.
- Autonomya voi käyttää myös "desk agenttina", eli hakea omalta koneeltaan tiedostoja
Miinukset - Agenttia täytyy toisinaan "juoksuttaa" verkossa pitkiäkin aikoja, ennenkuin olennaisia dokumentteja löytyy
- Kokeiluversio toimii epävarmasti
- Haun tulokset ovat hyvin riippuvaisia oikeanlaisista sanavalinnoista hakulauseessa