針對惡劣聚合頁,主要分為四種類型:
1、站點內容跨領域或過于分散
這個指的是網站中包含了太多領域的詞匯。例如你既要做游戲、又搞教育,還參與了加盟,甚至有電影。不僅搜索引擎無法識別你網站自身的專注領域,
用戶訪問你站點的聚合頁后,得到的體驗也是極差的。
這種網站一般都是通過采集拼湊的內容。而這種網站也基本可以理解為是完全基于流量目的的流量站。只能是站長單方面獲得了流量,但對用戶、對搜索引擎都是傷害的。
2、標題與內容不相符
這里所說的標題,更多的可以理解為是我們聚合頁面的關鍵詞,例如這個聚合頁你部署的關鍵詞是SEO培訓,而里面調取的內容有介紹游戲的、
介紹電影的等與關鍵詞本身不相關的內容。這樣即便搜索用戶進入到你這個聚合頁,還是不能很好的解決用戶需求!
3、利用站內搜索生成的聚合頁
利用站內搜索功能,批量生成靜態頁面,這種操作是批量生成聚合頁的慣用手法。多為大內容量較大的網站盛行。
SEO通過大量的關鍵詞整理,然后技術人員以這些詞為站內的搜索詞,將返回的搜索結果批量生成另一種模板的頁面。稱之為利用站內搜索做聚合頁最典型的方式。
這種頁面生成的技術含量最難點在于自身搜索引擎的技術能力。而很多網站又沒有專業的搜索引擎團隊,即便生成出來的內容,相關性差、頁面可讀性低。
同樣是勁風算法打擊的對象。
4、內容為空,或較少,以及失效的聚合頁
批量生成的聚合頁,以SEO為首,單純以獲取流量為目的的頁面。大多都會存在聚合頁內,調取的內容過少,甚至為空的現象。
這種類型的頁面可想而知,毫無用戶體驗可言。所以勁風算法對其進行懲罰也是早晚的事情!
勁風算法懲罰的目的
勁風算法,主要懲罰的對象是針對惡劣的聚合頁。
不管是網站還是百度智能小程序,都在勁風的懲罰范圍內。而基于這個算法的面世,其主要問題是行業內,存在很多單純以獲得流量為目的,
不管用戶搜索需求滿足度以及搜索體驗的聚合頁。百度為了保障搜索用戶在使用搜索引擎時的整體體驗,同時保證搜索排序的公平公正性。上線了勁風算法。
就是為了懲罰創造這一類聚合的網站。
他的周期是多久呢?
針對命中勁風算法之后,并不是說這個網站就從此廢掉了。只要改過自新、百度還是會給機會讓網站重新獲得百度的信任的。
而勁風算法的懲罰周期官方并沒有具體公布,但通過以往算法懲罰后的經驗推斷。一般在3~6個月左右。具體的要視情況而定!
命中勁風算法后,如何進行整改恢復呢?
那,命中勁風算法之后,我們就等著恢復嗎?如果不對網站進行整改是基本不可能恢復的。所以恢復的前提是你已經改過自新了!而針對整改我給出如下建議:
從大原則上,來看勁風算法懲罰的問題
前提要明確,聚合頁還是可以做的,只不過針對不能滿足搜索用戶需求,單純以獲取自然搜索來源流量為目的的,是不能再做了。你也不要報著上有對策、
下有政策的心態,想辦法去規避被懲罰。即便這一次你沒有命中,那么按照百度的慣例,還會有下一次的勁風算法2.0等著你。
具體的一些整改措施
1、針對網站領域過于分散的:
建議確定好一個主要的領域,且將其他領域的內容robots掉,屏蔽搜索引擎抓取,且不再參與搜索引擎排名;
更完美的方式是對其他領域的內容進行刪除,并將刪除的內容URL在百度搜索資源平臺提交404,確保網站無恙。
2、針對題文不相符的:
如果你有精力與資源,可以對應每一個聚合頁的主題進行審查,確保聚合頁下內容都是針對當前聚合頁主題所延展的相關內容。
從技術角度看,建議通過內容相似度計算的方式將網頁內的主體文本進行提取計算。得出當前聚合頁的主題與內容的相似度得分。
并通過實際觀察,確保相似度得分在哪個值上,是可以解決搜索用戶需求的。
例如通過觀察,我認為相似度得分達到62%(便于理解的假設值)的,基本都是相關頁面,那么針對低于62%的暫時就別在前端頁面進行展示了,
如果這類URL被訪問到建議設置404,并提交百度搜索資源平臺!
3、針對利用搜索批量生成的:
利用站內搜索批量生成的內容,其最關鍵的問題在于其內容無法滿足用戶需求。畢竟你的搜索引擎技術無法與百度相比。這里給出的建議是:
1.招聘精通搜索引擎的技術人員,針對搜索調取的內容相關進行大幅度提升。從而提升用戶的體驗度。
2.利用第3點提到的相似度判斷方式,讓編輯協助完成低于62%的聚合頁的內容撰寫工作。以此不斷提升滿足62%的內容量。
3.技術能力達不到的,可以通過其他辦法進行嘗試,但最終還是無法確保滿足用戶需求的,建議刪除或者robots操作。
4、針對內容為空或過于少,甚至無效的:
內容為空,甚至過少。在你站點內容資源很豐富沒得到更多調取到聚合頁的情況時,可以采取以下方式:
將更多品類的內容進行搜索整理,從而提升聚合頁下內容整體的豐富度,前期要保證相關性。例如我這個聚合頁是圍繞爬蟲抓取策略展開的,
那么其調取的內容都應該基于爬蟲抓取的策略,不能劍走偏鋒,適得其反!
其次,也可以給予你的聚合頁關鍵詞進行分類。例如爬蟲抓取、爬蟲算法、搜索引擎爬蟲、baiduspider,我們認為是一類聚合頁。當內容為空或少于X條時,
我們可以通過擴展調取的維度進行補全。
從技術需求的實現角度可以為:如果當前聚合頁下調取內容為0或不足X條時,那么調取當前聚合頁所屬關鍵詞同類別的其他內容,補全X條。
這樣一來,通過擴大調取的品類,以及給關鍵詞做分類形成補全規則問題就能很少的得到解決!
但如果你的內容資源信息很少,那么建議設定的邏輯為:當內容低于X條,甚至為空時,當前頁面返回404。另外,由于我們這些做了404的頁面已經被收錄或者爬蟲抓取了,
建議再提交百度搜索資源平臺的死鏈提交工具,進行完備。確保不會讓搜索引擎認為你網站存在大量的死鏈接!