搜索引擎的收錄工作就是發(fā)現(xiàn)網(wǎng)站—抓取—過濾信息—收錄—輸出索引內(nèi)容,如果你的網(wǎng)站未被收錄,就表示網(wǎng)站沒被發(fā)現(xiàn),或者其他原因?qū)е戮W(wǎng)站明明被爬行卻還是沒有被收錄。采取兩種方式來推出我們的網(wǎng)站,就是主動(dòng)提交網(wǎng)站和sitemap到站長平臺和通過制作外鏈來吸引蜘蛛爬行。
了解新站如何加速被收錄的方式,現(xiàn)在重點(diǎn)來剖析網(wǎng)站未被收錄的原因了。
第一,域名問題。一般如果你用的網(wǎng)站域名在之前有不良記錄,所以對于之后全新域名被收錄就會比較困難。因?yàn)檫@類域名需要時(shí)間有個(gè)考核期,在確定這歌域名所屬網(wǎng)站已經(jīng)不存在違規(guī)現(xiàn)象時(shí),才會將網(wǎng)站判斷信任網(wǎng)站,從而得到收錄。
第二,預(yù)收而不能。很多人都發(fā)現(xiàn)網(wǎng)站日志顯示有蜘蛛爬行過,但是任然沒被收錄。對于這個(gè)現(xiàn)象,就關(guān)乎蜘蛛的真假問題,這個(gè)暫時(shí)不詳細(xì)描述。先來了解為什么蜘蛛不能爬行網(wǎng)站。首先了解下蜘蛛爬行過程,域名轉(zhuǎn)為IP,轉(zhuǎn)化成相應(yīng)服務(wù)器,DNS解析,域名轉(zhuǎn)為IP,找到IP所在服務(wù)器來訪問,如果DNS出現(xiàn)問題亦或是空間服務(wù)商出現(xiàn)差池就會使得蜘蛛無法獲得數(shù)據(jù)。要是遇到這種情況,那必須得改空間商了,網(wǎng)站收錄問題就迎刃而解了。
第三,robot效應(yīng)。如果是網(wǎng)站設(shè)置了robot文件造成網(wǎng)站不能被收錄,那就只能因?yàn)榇中拇笠獗瘎×?。最初網(wǎng)站上線,因?yàn)榫W(wǎng)站細(xì)節(jié)上未能完善,很多人會提前在網(wǎng)站根目錄中加robot文件來禁止搜索引擎抓取,為了避免網(wǎng)站的不完整影響到延長考核期。所以當(dāng)你的網(wǎng)站計(jì)劃正式上線時(shí),站長一定要先檢查下是否去除了robot文件。