一般來說,計數器依是否會被灌水分為三種:
一、會被重新整理灌水的計數器:
這種計數器就是單純的一造訪就算點閱數。
二、關掉視窗再進入便可灌水的計數器:
這類計數器是利用session來防止重新整理網頁造成的灌水,基本精神大約是無論你在何時造訪,只要不要連續造訪,就算是同一個人,可以重複計數。
三、浮動IP重新開機便可灌水的計數器:
這類計數器是利用搜集造訪者的IP,然後設定造訪者在同一天、同一小時或同一個月等特定時間範圍內,無論造訪幾次,都只有頭一次造訪時會被計數。
目前本站已經改變成第三種計數器了,按我的觀察,要讓網路蜘蛛爬過網頁時不計數,似乎需要高深的技術,我不確定是不是難以做到,但是我好像看過有人的部落格因荒癈而人次掛零,理論上,網路蜘蛛爬過就會計數的話,應該是不容易掛零才對,所以,要麻是荒癈的太嚴重,不然就是真的有方法可以讓網路蜘蛛的造訪時不計數,總之該部落格我沒有長期觀察,也沒辦法像自己的網站這樣子做實驗,真相也不確定,也許不過是我去看時剛好都掛零而已。
為什麼會有網路蜘蛛造訪不計數是難以做到的結論,那是因為,我發現我就算利用網路上程式設計優秀的計數器(例如那個萬國計數器),或是google的Google Analytics 分析(註一),他們幾乎無法避免網路蜘蛛的造訪統計,就連Analytics也沒有過濾掉自家的網路蜘蛛造訪計數。
至於我為什麼如此肯定他們沒有過濾掉,那是因為萬國計數器仍然會對我之前確認為google的網路蜘蛛IP做計數,而Analytics 分析則是因為他收集到幾個網址都是資料庫裡沒有資料的日期,例如2009年9月4日當天我並沒有發文,一般人不可能也無法經由網站上的連結到這一天來查看文章,要到當日查看文章,唯一的方式就是進行網址的修改,但一般人應該不可能那麼做,那會這樣做的,恐怕就只剩亂爬的網路蜘蛛了吧。
之前提到過,利用連結的方式來計數,也就是點閱連結才計數,這種方法我發現失真的很厲害,尤其是我觀察發現,只有一半左右的人會從http://www.ttsalon.idv.tw進入本站,其他的都是直接進入http://www.ttsalon.idv.tw/tpintrts/,後者用點閱才計數的方式就根本不會被計數了。
雖然自己的技術不怎麼樣,不過既然幾乎全部的計數器都無法避免記錄網路蜘蛛的造訪,那麼就可以心安理得的設計並使用這種同IP在同日內造訪無論幾次都只算一次的計數程式了。
註一:google提供的一種對網頁造訪者的統計程式,統計能力強大,不只是哪些網頁被造訪可以統計,連造訪者是使用哪種瀏覽器或螢幕的解析度都能收集。
回 本站相關 分類
同分類上一篇:
被灌水的真相(下)
同分類下一篇:
投降