15295961084

桂林凡森网络科技

首页 >> 资讯中心 >>桂林网站优化推广资讯 >> 【桂林网站优化】搜索引擎的基本工作原理
详细内容

【桂林网站优化】搜索引擎的基本工作原理

    要想做好SEO,必须要简单的了解搜索引擎的基本工作原理以及自然排名机制。下面就让桂林网站优化凡森带你了解。

    

搜索引擎蜘蛛又称网页爬虫。目的:抓取高质量的网页内容。下面讲几个常见的搜索引擎蜘蛛分类:

1.1 Baiduspider(百度蜘蛛)

百度公司还有其它几个蜘蛛:Baiduspider-news(新闻)、Baiduspider-mobile(wap)、Baiduspider-image(图片)、Baiduspider-video(视频),站长经常见到的是Baiduspider和Baiduspider-image。

1.2 Googlebot(谷歌蜘蛛)

还发现一个Googlebot-Mobile,看名字应该是抓取wap内容的。

1.3 360Spider(360蜘蛛)

它是一个很“勤奋抓爬”的蜘蛛。

1.4 Sogou News Spider(搜狗蜘蛛)

还包括如下这些:Sogou web spider、Sogou inst spider、Sogou spider2、Sogou blog、Sogou News Spider、Sogou Orion spider,看最权威的百度的robots.txt  http://www.baidu.com/robots.txt 就为Sogou搜狗蜘蛛费了不少字节,占了一大块领地。

SEO搜索引擎基本工作原理

image.png

搜索对seo的基本原理三大阶段:排序、索引、抓取。SEO搜索引擎的工作原理过程是非常复杂的

抓取

 

  搜索引擎会抛出一种被称作“机器人,蜘蛛”的软件根据一定的规则扫描互联网上面的网站 ,沿着网页的链接从一个网页到另一个网页,从一个网站到另一个网站,获得页面HTML代码,并存入数据库。为了采集到最新的资料,会继续回访已抓取过的网页。

 

   索引

 

    由分析索引系统程序对收集回来的网页进行分析,提取相关网页信息,根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面文字中及超链中每一个关键词的相关度,然后用这些相关信息建立网页索引数据库。

 

    排序

 

    当用户输入关键词搜索后,由搜索系统程序从网页索引数据库中找到符合该关键词的所有相关网页。因为所有相关网页针对该关键词的相关度早已算好,所以只需按照现成的相关度数值排序,相关度越高,排名越靠前。最后返回给用户。

 

    搜索引擎的工作原理大体分为3步:爬行抓取——索引——排序。

 

    抓取:主要是数据收集。

 

    索引/预处理:提取文字——中文分词——去除停止词——消除噪声——去重——索引。

 

    排序:搜索词处理——匹配文件——初始子集选择——相关性计算——过滤、调整——排名显示。