|
网络推广优化时间:2021-05-31 网络推广优化
http的工作原理 在浏览器中输入一个网址向网站服务器发送http请求,网站服务器接收并解析此请求进行响应,向浏览器客户端返回响应,以http超文件的形式发送给客户端浏览器,以图文并茂的形式展现在用户眼前。 对于网站服务器系统来说,通过浏览器向用户返回的都是网页代码,它并不能知道传输的是文字,还是图片,最后通过web浏览器对网页代码进行渲染,用户看到才是图文并茂的网页内容。 如果我们想要更多的了解搜索引擎,对于http网页的工作原理还是需要有一定了解的。 2、搜索引擎抓取三步曲 搜索蜘蛛对于一个新网页内容,先会抓取网页链接,再进行分析过滤网页链接内容,达到收录标准的内容则进行收录,未达到收录标准的内容则直接删除了,已收录的内容根据搜索算法规则进行排序,最后呈现关键词查询与排序结果。 作为我们只需要知道搜索引擎蜘蛛抓取的三步曲就行了,为“抓取—过滤—收录”这么一个过程。 二、如何提升抓取减少过滤 搜索蜘蛛是以游客匿名身份抓取你网页内容的,如果你的网页内容需要输入帐号密码才能访问,这种页面搜索蜘蛛是无法抓取的,需要将开放给搜索引擎,这样搜索蜘蛛才能抓取你的网页内容,注意千万不要限制搜索蜘蛛抓取。 搜索引擎蜘蛛对于网页内容的可识别性并不高,它只认识文字,例如你网页中的图片如果没有加alt属性,搜索蜘蛛是无法知道图片所要表达的意思,还有视频、JS文件、flash动画、ifame框架内容,搜索蜘蛛都是识别不了的,这些内容很有可能变会被搜索蜘蛛给过滤掉,所以我们在设计网页时,就需要考虑网页内容能不能被搜索蜘蛛识别抓取,如果你的网站页面不需要搜索蜘蛛抓取,也不需要在搜索引擎中参与排名,那就另说了。 当搜索蜘蛛成功抓取网页内容后,然后就是过滤,过滤掉那些不符合搜索引擎收录标准的内容,例如对当前抓取的网页内容进行筛选、剔除,分析网站页面的质量度,计算当前网站页面的权重大小,检查网页更新时间顺序,判断当前抓取的内容对于用户是否有价值。 我们也可简单理解为过滤就是筛选出对于用户无价值、质量度低的内容,保留对用户有价值,质量度高的内容,如果你想提高网站页面的收录率,建议尽量更新对用户有价值,符合搜索引擎收录标准的内容,不要更新低质采集拼接内容。 |
