程式者的胡言亂語
嘖嘖,這是黑米丁丁化的開始嗎?
話說黑米有了新版的「黑米數位 (HEMiDEMi.com) 服務條款」,嘖嘖,不知不覺偷偷加了兩條呢?
· 除了透過黑米提供的API或標準資料格式(如RSS),或經本公司書面同意,任何人不得使用任何程式或工具(如robot/spider等)以非人為操作方式使用本站。另外,不得有以下行為:
- 以任何方式,在「黑米」的合理判斷下,施加、或可能施加不合理或異常負擔至「黑米」的網站架構
- 干擾或試圖干擾「黑米」網站或與「黑米」相關服務之正常運作
- 試圖略過「黑米」限制網站使用或讀取的機制與方式
· 其他「黑米」有正當理由認為不適當之行為
這看來是針對本黑米外掛計畫而來的啊!這真是太妙啊!妙在那邊呢?這是新版的條款,當初我們註冊帳號時,簽的可是舊版的,如果是這樣的話,是不是不算數啊?XD如果算數的話,以後黑米就加一條:使用者如果使用黑米的服務,必須每月支付一百萬元新台幣,並且溯及以往,如果不溯及以往的話,那我的帳號當初沒有簽這個新版的,所以是不是就不算數了?
嘖嘖,連法律訴訟的部份都寫上來了,有興趣的話,去查一下這一份頁面在Google的頁庫存檔就可以比對一下了。
另外還有一個很妙,Google沒有簽這個條款,所以Google總可以去爬吧?如果法律上Google也不能去爬的話呢?我個人極力主張黑米去告Google,因為Google索引了他們的網頁(而且我相信Google每天index的量一定比我多),而侵犯到他們的商業權利。從今以後,Google不應該再能夠搜尋到黑米上的書籤網頁。如果黑米去告Google,我個人自掏腰包,贊助兩萬塊律師費!
一般來說,一個網站會用robots.txt來指引spider的行為。我們來看看此時此刻(因為很快就會再推出新版了,敬請期待!)黑米的robots.txt長什麼樣:
Disallow: /bookmark/click
Disallow: /bookmark/users
Disallow: /bookmark/search
Disallow: /user_bookmark/search
#Disallow: /user/*/bookmark/tag
Disallow: /user/*/bookmark/click
Disallow: /group/*/bookmark/users
Disallow: /group/*/bookmark/click
Disallow: /tools
Disallow: /search/bookmark
Disallow: /search/user_bookmark
Crawl-delay: 10
Crawl-delay才設10秒耶。
沒問題,我會遵守的。現在設的這麼長似乎太小看黑米承受流量的能力了,我會把它調的更小。另外,這些Disallow的,我都沒有去爬,所以我很守規矩,是個好小孩。另外,我要說明的是,我用的勉強算是robot,而不是spider,像Google這樣的spider,會掃更多的內容,我已經盡量的只取很少的部份,而且,更重要的是,不知道別人有沒有像我一樣很客氣,我送出去的request裡都有註明我接受GZIP壓縮,而黑米也會真的用GZIP壓縮給我,所以流量大概又更省,變成了十分之一左右。話說到這,我要惡整你,連GZIP都不用,直接叫你傳原檔,不是更能把你的流量吃掉,多幫你花頻寬費?為什麼要以小人之心度君子之腹呢?我每天不過就打你頂多一兩百個page view而已,覺得黑米的機器撐不起,先把robots.txt裡的Crawl-delay設大一點啊。對Google就這麼客氣,對我的服務就要使出BAN IP這一招嗎?不過就是做做研究嘛,大家一起來看看社交書籤能做什麼功能嘛,交流一下,切磋一下也很不錯啊。我的search result還幫你放一個黑米的圖示連回黑米的本站,有沒有看到?我要惡搞的話,就不會這好心了。不歡迎robot的話,請Disallow: *,我會遵守,不會去捉。不要對Google或其他的search engine和對我的robot有差別待遇!
這就是Web 2.0的分享嗎?這就是Web 2.0的open mind嗎?這台灣Web 2.0的龍頭指標,為Web 2.0的開放分享精神,下了最佳的註腳。
這篇的最後我要說,如果黑米站方真的很不開心,希望我不要再用程式捉了,寫一篇公告或私底下寫信給我,我會照辨,我會號召認識的朋友,每天到我的服務上來手動輸入書籤,一天幾百則,人工做的來呀。這樣總行了吧。
最後再補充一點,「除了透過黑米提供的API或標準資料格式(如RSS)」這一句實在歡樂,這使得我決定為我的robot提供一個RSS服務,到時再歡迎大家用這個RSS來爬黑米的網頁喔。
Posted at 12:00下午 六月 08, 2007 by Chien-Hsing Wang in 黑米蟲 | 迴響[6]
星期五 六月 08, 2007

剛剛看到黑米條款第一條是這麼寫的:"「黑米」有權於任何時間修改或變更本約定書之內容,建議您隨時注意該等修改或變更。您於任何修改或變更後繼續使用「黑米」,視為您已閱讀、瞭解並同意接受該等修改或變更。若您不同意以下所述內容,請暫時不要參與黑米網站上的活動。"
銀行在變更信用卡使用條款時,也不會像黑米這樣惡霸吧!
由...發表 黑米二年級生的感嘆 on 六月 08, 2007 at 12:33 下午 CST #
qing 息怒 :P
.ck 今天因流量過多關掉服務, .ck 做的也很多人愛用, 黑米也很歡迎他的小工具啊 http://flickr.tw/2007/06/_scriptlets.html
不過我不懂, 像.ck 有使用黑米提供的 API 嗎?
善意看待的話, 可以問看看黑米書面條款內容,
這樣developer 們也有公開遵循的依據 :)
我有用 qing 的 search 找東西, 然後又連回黑米看書籤討論, 這對黑米流量應該有幫助才是。
由...發表 cjin on 六月 08, 2007 at 12:45 下午 CST #
非常認同原 PO...
由...發表 Goston on 六月 08, 2007 at 12:53 下午 CST #
這樣的服務條款很正常吧,站方保留拒絕的權利,並不代表一定要去實行。留有這樣的條款,有一天網站如果流量真的承受不住,就有理由可以拒絕來自像Google/Yahoo等機器人的爬文。這是很合理的規範。
Google可以透過robots.txt來規範,可是其他的程式並不一定會遵守這個規則。
就算要看robots.txt的規則好了,我比較不懂的是,為什麼原 PO 會覺得站方是針對自己呢?因為站方的 robots.txt 並還沒有擋掉任何robot (UserAgent)呀。在我看來,這是再普通不過的條款啊。
由...發表 poka on 六月 08, 2007 at 04:08 下午 CST #
To Poka,
我不反對站方這麼寫, 而且每個站都應該適度的保護自己的權利. 這篇blog只是想點出一些寫的很奇怪的地方.
另外, 這個公告是在這一兩天才出現的, 我當然不希望往自己臉上貼金啦, 不過這個過程中發生的步驟就是, (1) 黑米開始檢查UserAgent (2) 黑米直接BAN掉我的IP (3) 新版服務條款, 分別對應到我有做的三個動作的時間點
由...發表 Qing on 六月 08, 2007 at 05:17 下午 CST #
~~~「黑米」有權於任何時間修改或變更本約定書之內容,建議您隨時注意該等修改或變更。您於任何修改或變更後繼續使用「黑米」,視為您已閱讀、瞭解並同意接受該等修改或變更。若您不同意以下所述內容,請暫時不要參與黑米網站上的活動。~~~
建議黑米使用者由黑米服務條款http://www.hemidemi.com/help/term登入
萬一哪天黑米默默改為每位使用者要付費100萬美金
那不得了
從服務條款登入較安全
黑米丁!加油!馬總統都挺丁丁
由...發表 203.70.79.140 on 六月 08, 2007 at 07:59 下午 CST #