你知道吗?其实搜索引擎就像一个高级“吃货”,它会到处找“吃的”,却又很“挑食”,因为它只吃它爱“吃”的,那么它喜欢吃什么呢?
首先了解一下,百度搜索引擎的抓取方式。百度搜索引擎是怎样抓取的?百度搜索引擎的抓取是由百度抓取程序(baiduspider,俗称百度蜘蛛)顺着网页中的超链接,在互联网中发现、搜集页面。
百度搜索抓取方式分为两种:深度抓取和广度抓取,深 度抓取是指先针对一个一级页面的子栏目进行抓取(首页>页面1-1>页面2-1),广度抓取是指从同级别栏目抓取(首页>页面1-1、页面1-2、页面1-3>页面2-1、页面2-2、页面2-3)
过滤,搜索引擎就像筛子一样,以它想要的标准对抓取来的“美食”进行筛选,取其精华去其糟粕,好的留下,不好的就被过滤了,所以,如果你的网页被收录了但是搜索不到,就说明是因为网页质量不好,被搜索引擎过滤了。
注意!
不利于百度搜索引擎抓取的内容:js、图片、flash、frame、iframe、嵌套table、需要登录页面之后的页面,我们在建设网站时,应注意尽量避免出现这些内容。