Google搜尋排名與判定Spam的依據

作者: Jas / 發表於 2007-03-26

無意間在網摘堆裡瞄到這篇「Blogger你可以再過份一點」,本以為是在一竿子打翻一船人地罵寫blog的人,或者是在跟某個碰巧叫做Blogger的傢伙嗆聲,沒想到原來是在對blogger.com撂狠話。

事實上,讀過這篇文章之後,不難發現:除了對發文者來說,那的確是很好用來發洩心中怨氣之外,對我們這些其餘他者而言,幾乎是了無助益的(或者說煽動情緒對改善現實,經常是了無助益的)。

就我自己使用blogger.com的經驗來說,這一千多個日子以來,就遇過兩個blog各被判定為spammer一次的經驗。遇到這種事,當下不爽是一定的,但,為了成就Anti-spam的大業著想,還是一次一次按照頁面指示去證明自己的清白。往好處想,忍一時一己的不便,成就一個blogging平台的清淨安寧,其實並沒什麼大不了(至少,相對於自架blog一天得要對付成千上百個spam來說,是相當值得的投資)。

再者,blogger.com,或者說google,在進行Anti-spam的判讀上,其實也並非絲毫無跡可循,事實上,光就他們在2005年取得的專利「Ranking blog documents」而言,就已經對搜尋排名與判定Spam的依據說明得十分清楚。

簡言之,Google用來決定搜尋排名與判定Spam的依據,就是正向指標負面指標,如果你沒時間去細讀Ranking blog documents,也許可以參考以下的摘錄說明(事實上,這些指標還算蠻常識性的):

(一)正向指標

  1. 部落格受歡迎的程度 [0037]
  2. RSS feed被訂閱數 [0038]
  3. 連結出現在搜索結果及被點閱的次數 [0039]

  4. 部落格的連結出現在其他部落格連結清單的次數(若出現在相同定義下所謂「優質部落格」則更優先加分)[0040]
  5. 使用標籤作為文章分類 [0043]
  6. 連結出現在電子郵件或聊天記錄裡的頻率 [0044]
  7. PR值的高低 [0045]

(二)負面指標

  1. 文章內容大小是否經常相彷 [0046]
  2. 文章連結是否經常指向同一位址 [0046]
  3. 發文頻率固定;或符合可預期模式;或經常在預定時間內大量發佈 [0047]
  4. RSS輸出的內容與Blog頁面上不同 [0048]
  5. blog出現重複內容的數量與頻率 [0049]
  6. 使用spam blog慣用的關鍵字[0050]
  7. 是否存在大量廣告 [0053]
  8. 廣告的擺置是否明顯喧賓奪主[0054]

顧名思義,正向指標愈多愈有助於提昇搜尋排名;負面指標愈多則愈有被判定為Spam之虞。

technorati tag




回上方