No, jatketaan nyt kuitenkin vielä hetki täällä - vaikka sillä selityksellä, että on hieno asia että JuttuKlubikin näkyy Googlessa

.
Niin, spider (tai crawler tai botti) on ohjelma, joka käy systemaattisesti läpi netistä löytyviä sivuja pyrkien lukemaan kaikki mahdolliset vastaan tulevat sivut ja etsii sivuilta milloin mitäkin. Osa on asiallisia ja hyödyllisiä, kuten tämä Googlen spideri, jota ilman sivut eivät näkyisikään Googlessa. Se lisää Googlen hakutietokantaan esim. JuttuKlubin keskusteluista löytyneet sanat ja salaisella reseptillä myös tiedon siitä, kuinka korkealle sivut hakutuloksissa rankataan. Osa spidereista sitten taas on asiattomia - ne etsinevät pääasiassa sähköpostiosoitteita, jotka lisätään erilaisille roskapostiosoitelistoille. Ja näitä listoja sitten taas myydään hyvällä hinnalla roskapostittajille, tai listojen kerääjät eli näiden bottien käynnistäjät saattavat itsekin hoitaa roskapostien lähettämisen - mainostajat vain antavat heille lähetettävän mainoksen ja maksavat esim. lähetettävien viestien määrän mukaan.
Yritys bannata ilkeitä botteja ip-osoitteen perusteella on melko toivotonta - ne taitavat suurimmaksi osaksi olla ihan tavallisten käyttäjien koneille jostain tarttuneita haittaohjelmia, jotka toimivat aikansa ja lähettävät löytämänsä osoitteet jonnekin keskitetylle listalle. Eli jos bannataan yhden botin ip-osoite, kohta on tilalla seuraava. Ja samalla voi tulla bannatuksi jonkun oikean käyttäjän osoite.
Asialliset spiderit, kuten tämä Googlen ötökkä, toimivat kohteliaasti ja jättävät lukematta sellaiset sivut, joiden koodissa on erikseen mainittu, että sivua ei ole tarkoitettu hakukoneille. Vähemmän asialliset eivät sitten tietenkään näin toimi vaan tutkivat kaiken mihin kiinni pääsevät.
Jäsenalue tosin luultavasti pysyy ilmankin tuota indeksointikieltoa ainakin hakukonespidereiden ulottumattomissa, koska se vaatii kirjautumisen - ja hakukonespiderit eivät luonnollisesti myöskään yritä rekisteröidä feikkitunnuksia päästäkseen kirjautumaan. Ja ilkeille boteille taas ei välttämättä ainakaan kovin usein ole hyötyä, vaikka ne onnistuisivatkin rekisteröitymään ja kirjautumaan, ne kun tavallisimmin etsivät vain niitä sähköpostiosoitteita.
Mutta tuo ohje olla kirjoittamatta sähköpostiosoitteita selväkielisesti, siis @-merkillä ja varsinkin mailto-linkillä varustettuna, pätee kyllä nykyään ihan kaikkialla netissä. Juuri @-merkkiä ja sitä ympäröivää tekstiä spämmibotit etsivät. Paljon nähty tapa merkitä mina(at)jossain.com ei sekään liene nykyään paljoa turvallisempi - tuo on niin yleinen kiertotie, että kun spämmibotteja kehitetään jatkuvasti taitavammiksi, niin eiköhän tuo (at) tarkoita niille nykyisin ihan samaa kuin varsinainen @-merkkikin. Ja pelkään, että mina@REMOVE_MEjossain.com saattaa yhtä lailla olla jo vanhaa kauraa. Suomeksi POISTA tosin lienee jo pahempi rasti... Mutta eihän tuo ole järin kaunista.
Oikeastaan ainoa tällä hetkellä idioottivarma tapa julkaista netissä sähköpostiosoite spidereilta turvassa on laittaa se sivulle kuvana. Tälllöin tosin sitten osoitetta tarvitseva joutuu sen kirjoittamaan kokonaan itse kopioinnin sijasta. Melko varma temppu on myös korvata pelkkä @-merkki merkkiä esittävällä kuvalla, varsinkin jos kuvaa ei nimeä at.gif:iksi. Taas esim. suomenkielinen miau.gif on suht toimiva vaihtoehto.
Toinenkin toistaiseksi toimiva tapa on, mutta se vaatii html-koodiin käsiksi pääsemistä: merkitään koodiin osoite tavallisten kirjainten sijasta kirjaimia vastaavia numerokoodeja, esim. "markku" kirjoitetaan "markku". Sivulla osoite näkyy ihan normaalisti, ja on myös kopioitavissa - ja jopa mailto-linkki toimii klikkaamalla. Näitä koodeja eivät botit tähän mennessä ole oppineet tulkitsemaan, mutta lienee vain ajan kysymys, ennen kuin ne keksivät tämänkin konstin.
Ikävintä näissä roskapostilistoissa on se, että kun osoite on yhden kerran joutunut joltain sivulta jollekin listalle, se saattaa sen jälkeen levitä epidemian tavoin, vaikka osoitteen poistaisikin sivulta - lista jää silti kiertämään ja leviämään.
Tulipas tästä luento, toivottavasti jollekin oli hyötyä.
Muutaman sanan tiivistelmä: kaikki spiderit eivät ole huono juttu, ja sähköpostiosoitetta ei koskaan kannata nettiin laittaa semmoisenaan.