有关seo #3

klouskingsley · 2016-12-10T15:30:49Z

title: 有关seo的东西
date: 2016-08-17 20:37:47
tags:

seo

1.robots.txt 文件

搜索引擎蜘蛛爬取网站的时候首先会爬去根目录下的robots.txt文件，然后根据里面的规格进行爬取。

三个关键字：User-agent, Disallow, Allow
User-agent 指搜索引擎类型，如百度BaiduSpider, 谷歌Googlebot, 必应Bingbot
Disallow表示你屏蔽蜘蛛爬取这个目录，如Disallow: /admin 表示屏蔽admin目录
Allow表示允许蜘蛛爬去这个目录，如Allow: /public 表示允许蜘蛛爬取public目录

但如果你这样将父目录设为Disallow, 而将子目录设为Allow, 这个时候Allow是无效的。
如：

Disallow: /
Allow: /public   还是不会被收录

示例选取淘宝的robots.txt文件的部分内容

User-agent: Baiduspider         
Allow: /article                 
Allow: /oshtml                  
Allow: /product                 
Allow: /spu                     
Allow: /dianpu                  
Allow: /wenzhang                
Allow: /oversea                 
Disallow: /

User-Agent: Googlebot
Allow: /article
Allow: /oshtml
Allow: /product
Allow: /spu
Allow: /dianpu
Allow: /wenzhang
Allow: /oversea
Disallow: /

2.title，description, keywords

title

title是网站的标题，显示在浏览器标签页处。
title的分隔符一般用 , - _ 等，其中_对百度比较友好，-对谷歌比较好，空格较少用。title长度一般pc端30个中文，移动端20个中文，超过会截断为省略号。

title 格式

首页：网站名称　　或　　　网站名称_提供服务介绍or产品介绍
频道页：频道名称_网站名称
文章页：文章title_频道名称_网页名称

description

description不是权值计算的参考因素，但会影响用户体验，如：
上面是没加description的，下面是加了description的

keywords

用来告诉搜索引擎你网页的关键字是什么，多个关键字用小写逗号隔开，如慕课网的keywords

<meta name="Keywords" content="慕课网，慕课官网，MOOC，移动开发，IT技能培训，免费编程视频，php开发教程，web前端开发，在线编程学习，html5视频教程，css教程，ios开发培训，安卓开发教程" />

3.前端页面编码

首页链接控制在100个以内，不要过多也不要过少
页面层次不要过深
使用html5语义化标签，让蜘蛛知道你页面的结构
不要使用div.header, div.content, div.footer, span.button等无语义化的标签结构，ie8的html5兼容可以使用html5.js库。
给img标签加alt属性
给a标签添加title属性
给外部网站的a标签添加rel="nofollow"属性，告诉蜘蛛不要往下走了，不然可能回不来了。
br标签只能在p标签等表示段落文本的标签内使用，不要使用br来排版
正文标题使用h1标签，副标题使用h2标签，样式用css控制
给table表格加caption标签，用来给表格指定标题
不要使用iframe框架
如果内容很重要不要使用display:none隐藏，使用z-index代替
给分页条尾页，下拉页等
重要内容写在前面，广告等内容写后面，重要内容不要使用js输出

4.url规范化

统一链接

http://baidu.com 和 http://baidu.com/index.html 是同一个页面，同一使用http://baidu.com
网站变更时，将原来的链接重定向到现在的页面
使用canonical表示页面的唯一性，如

    http://www.harrytse.com?from=wechat
    http://www.harrytse.com?from=weibo
    http://www.harrytse.com?from=qq

可以看到上面三个链接都是同一个页面，只是用get参数区分不同的来源，可以在head上加上canoical表示页面唯一。

<link rel="cononical" href="//:ke.qq.com/download/download/app.html" />

5.相关工具

google robots.txt测试工具

The text was updated successfully, but these errors were encountered:

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

有关seo #3

有关seo #3

klouskingsley commented Dec 10, 2016

有关seo #3

有关seo #3

Comments

klouskingsley commented Dec 10, 2016

1.robots.txt 文件

2.title，description, keywords

title

description

keywords

3.前端页面编码

4.url规范化

5.相关工具