海內(nèi)的搜索引擎注冊還沒有形成市場,但在國外是很發(fā)達(dá)的工業(yè),每年以200%的速度增長,它們叫seo,即search engine optimization。 ” 越來越多的網(wǎng)站開始追求收入追求pageview,它們開始欺騙搜索引擎,它們在meta tag中塞進(jìn)成堆的樞紐字,塞進(jìn)跟自己的網(wǎng)站內(nèi)容無關(guān)的但是流行的樞紐字。起初,meta tag是很好用的,那時(shí)候,老實(shí)的webmaster們?nèi)鐚?shí)的填寫網(wǎng)站摘要,如實(shí)的列出跟他的網(wǎng)站最相關(guān)的樞紐字,搜索引擎?zhèn)冏ト ⑺饕z索這些老實(shí)的meta tag,并作為搜索結(jié)果排序的重要依據(jù),然后,是一段息事寧人的甜美時(shí)光。現(xiàn)在流行的太極鏈、鳳凰鏈這些超鏈群,就存在被當(dāng)做spam的可能性。。。
。 “一旦有適當(dāng)?shù)睦麧櫍Y本就大膽勇敢起來……有50%的利潤,他就鋌而走險(xiǎn);有100%的利潤,他就敢轔轢一切人間法律;有300%的利潤,他就敢犯任何罪行,甚至冒絞首的危險(xiǎn)。
從某種角度來說,幾乎是spam在推動著搜索引擎的提高,良久良久以前的一天,搜索引擎?zhèn)優(yōu)榱怂阉鹘Y(jié)果能更正確,為了能把最相關(guān)的搜索結(jié)果排在前面,發(fā)明了meta tag。
歲月迅速流逝,甜蜜時(shí)光擋不住資本的力量。
作弊者以進(jìn)為退,開始第二輪攻擊,他們在正文中大量使用與網(wǎng)頁背景相同顏色的樞紐字,在image tags中塞進(jìn)樞紐字,在網(wǎng)頁代碼加入“看不見的注釋”。群眾的力量是巨大的,搜索引擎的相關(guān)性被破壞了。
搜索引擎在與spam的長期戰(zhàn)爭中總是處于不利地位(這很等閑理解,搜索引擎公司真正考慮搜索結(jié)果相關(guān)性和排序的只有幾個(gè)人,而互聯(lián)網(wǎng)上整天琢磨怎么對付搜索引擎的有幾萬幾十萬webmaster),所以對spam的懲罰很嚴(yán)厲,事實(shí)上,所有的搜索引擎對它們認(rèn)定的spam行為,通常只有一種懲罰:永久屏蔽。
搜索引擎?zhèn)儗ψ鞅渍唛_始第一輪反擊,但是無力的,它們的做法是:在排序時(shí)更多的依靠網(wǎng)頁正文而不是meta tag。
但是,嚴(yán)肅的懲罰從來只是無能者推卸責(zé)任的借口,而不能真正的改善狀況。 ” 作弊者從來就不怕懲罰,當(dāng)互聯(lián)網(wǎng)狂潮來臨,追求pageview的作弊者們更是毫無所懼。
善良是善良者的墓志銘,卑鄙是卑鄙者的通行證”,作弊者眼見常規(guī)武器無效,開始利用搜索引擎的真誠。這種方法叫做cloaking。于是,作弊者精心制作了兩個(gè)網(wǎng)站,一個(gè)專供網(wǎng)友訪問,一個(gè)專供搜索引擎訪問,每當(dāng)發(fā)現(xiàn)訪問哀求來自搜索引擎時(shí),就返回專供搜索引擎看的能令搜索引擎滿足的網(wǎng)頁,而正常訪問者只能看到另一個(gè)截然不同的網(wǎng)站。搜索引擎能做的只是嚴(yán)肅的懲罰被發(fā)現(xiàn)的spam,以警告作弊者,發(fā)展到今天的結(jié)果是,所有的搜索引擎對它們認(rèn)定的spam行為,只有一種懲罰:永久屏蔽。
深圳網(wǎng)站建設(shè):搜索引擎?zhèn)儯捎谒鼈兊赖律系娜觞c(diǎn),由于有些手段不愿用,所以無法完全辨別cloaking網(wǎng)站,也就無法完全對付作弊者。 “一旦有適當(dāng)?shù)睦麧櫍Y本就大膽勇敢起來……有50%的利潤,他就鋌而走險(xiǎn);有100%的利潤,他就敢轔轢一切人間法律;有300%的利潤,他就敢犯任何罪行,甚至冒絞首的危險(xiǎn)。這第三輪攻擊,作弊者大勝。
搜索引擎的spider是互聯(lián)網(wǎng)上的謙謙正人,它們訪問任何網(wǎng)站都會自報(bào)身份,并且查閱網(wǎng)站的訪問劃定,完全按照各網(wǎng)站的規(guī)矩來辦事。
一個(gè)網(wǎng)頁,說它自己是什么,它就是什么嗎?物以類聚,假如它說的是真的,那么指向這個(gè)網(wǎng)頁的鏈接應(yīng)該來自具有同類內(nèi)容的網(wǎng)頁,所以指向這個(gè)網(wǎng)頁的鏈接可以被用來驗(yàn)證這個(gè)網(wǎng)頁的相關(guān)性。
無可奈何的搜索引擎,只有去尋找新的相關(guān)性排序依據(jù),只有去尋找作弊者不能控制的排序依據(jù),只有去網(wǎng)站以外尋找排序的依據(jù),搜索引擎,真的別無選擇。
于是,開始泛起了超鏈分析,泛起了pagerank。
但是pagerank也帶來了一些不請自來的錯(cuò)誤排序因素:新站不如舊站,小站不如大站,專業(yè)站不如通俗站。
而一個(gè)歷史悠久的老網(wǎng)站、大網(wǎng)站、通俗網(wǎng)站,即使它已久不更新,或者內(nèi)容遠(yuǎn)不如某些小網(wǎng)站,卻可以獲得很高的排名。一個(gè)新網(wǎng)站,一個(gè)小網(wǎng)站,一個(gè)專業(yè)網(wǎng)站,它的內(nèi)容再好,由于不可能迅速得到大量的超鏈,所以無法得到合適的排名,即使它的內(nèi)容是無與倫比的。所以,在超鏈分析中,gov和edu網(wǎng)站通常被賦予較高的排名,來自gov和edu的超鏈也有更高的價(jià)值。
誰,最不可能出于貪婪而作弊?誰,最可能如實(shí)提供網(wǎng)頁內(nèi)容?是政府網(wǎng)站,和教育網(wǎng)站。
這種seo方法被稱為link firm。這種方法剛泛起時(shí)還算有效,不外很快就不行了,由于一個(gè)網(wǎng)站是否有大量來自內(nèi)容不相干網(wǎng)頁的鏈接,或者一個(gè)不是搜索引擎的網(wǎng)站給出大量不相干的鏈接還不難判定。
只是,讓計(jì)算機(jī)學(xué)會理解和評價(jià)網(wǎng)頁內(nèi)容嗎?似乎仍是很遙遠(yuǎn)的事情;花大量的人力一個(gè)個(gè)網(wǎng)頁評估么?這肯定是虧本的貿(mào)易行為,只有靠志愿者。
一種搜索結(jié)果的排序算法,假如更多的是基于概念、主題、基于網(wǎng)頁內(nèi)容的質(zhì)量,而不是網(wǎng)絡(luò)上互相鏈來鏈去的超鏈的重要性,那么搜索結(jié)果的相關(guān)性在本質(zhì)上會更好。而每當(dāng)發(fā)現(xiàn)一個(gè)link firm,那些使用了該link firm的網(wǎng)站就全部死翹翹。 odp庶幾近之,但也只能點(diǎn)擊,用樞紐字搜索時(shí)仍是無法跟超鏈分析的結(jié)果比擬。我在wmw的論壇上看過一個(gè)家伙的帖子,說他的網(wǎng)站被封了,但他覺得自己很干凈,沒有做spam,所以主動去問google封他網(wǎng)站的原因,原來僅僅是由于他用了一個(gè)link firm,真是可憐.
當(dāng)超鏈分析剛出來時(shí),seo界一片悲觀論調(diào),以為這是無法作弊的,seo業(yè)完蛋了(就象近期各搜索引擎紛紛收費(fèi),seo業(yè)更覺得自己遠(yuǎn)景慘淡,實(shí)在固然搜索引擎排名市場的大頭要給搜索引擎?zhèn)儯玸eo仍是有錢賺的,究竟,只有勞動模范有下崗的可能,從來沒聽說騙子會失業(yè)的),但是,道高一尺魔高一丈,很快seo們發(fā)現(xiàn)了對付超鏈分析的方法:你不是喜歡鏈接么,好,我就做大量的網(wǎng)站,預(yù)備大量的鏈接,哪個(gè)客戶出錢,我所有的網(wǎng)頁都給它一個(gè)鏈接。
【 微信掃一掃 】