Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

有关seo #3

Open
klouskingsley opened this issue Dec 10, 2016 · 0 comments
Open

有关seo #3

klouskingsley opened this issue Dec 10, 2016 · 0 comments

Comments

@klouskingsley
Copy link
Owner


title: 有关seo的东西
date: 2016-08-17 20:37:47
tags:

  • seo

1.robots.txt 文件

搜索引擎蜘蛛爬取网站的时候首先会爬去根目录下的robots.txt文件,然后根据里面的规格进行爬取。

  • 三个关键字:User-agent, Disallow, Allow
    User-agent 指搜索引擎类型,如百度BaiduSpider, 谷歌Googlebot, 必应Bingbot
    Disallow表示你屏蔽蜘蛛爬取这个目录,如Disallow: /admin 表示屏蔽admin目录
    Allow表示允许蜘蛛爬去这个目录,如Allow: /public 表示允许蜘蛛爬取public目录

但如果你这样将父目录设为Disallow, 而将子目录设为Allow, 这个时候Allow是无效的。
如:

Disallow: /
Allow: /public   还是不会被收录

示例选取淘宝的robots.txt文件的部分内容

User-agent: Baiduspider         
Allow: /article                 
Allow: /oshtml                  
Allow: /product                 
Allow: /spu                     
Allow: /dianpu                  
Allow: /wenzhang                
Allow: /oversea                 
Disallow: /

User-Agent: Googlebot
Allow: /article
Allow: /oshtml
Allow: /product
Allow: /spu
Allow: /dianpu
Allow: /wenzhang
Allow: /oversea
Disallow: /

2.title,description, keywords

title

title是网站的标题,显示在浏览器标签页处。
title的分隔符一般用 , - _ 等,其中_对百度比较友好,-对谷歌比较好,空格较少用。title长度一般pc端30个中文,移动端20个中文,超过会截断为省略号。

title 格式

  • 首页:网站名称  或   网站名称_提供服务介绍or产品介绍
  • 频道页: 频道名称_网站名称
  • 文章页: 文章title_频道名称_网页名称

description

description不是权值计算的参考因素,但会影响用户体验,如:
上面是没加description的,下面是加了description的

keywords

用来告诉搜索引擎你网页的关键字是什么,多个关键字用小写逗号隔开,如慕课网的keywords

<meta name="Keywords" content="慕课网,慕课官网,MOOC,移动开发,IT技能培训,免费编程视频,php开发教程,web前端开发,在线编程学习,html5视频教程,css教程,ios开发培训,安卓开发教程" />

3.前端页面编码

  • 首页链接控制在100个以内,不要过多也不要过少
  • 页面层次不要过深
  • 使用html5语义化标签,让蜘蛛知道你页面的结构
    不要使用div.header, div.content, div.footer, span.button等无语义化的标签 结构,ie8的html5兼容可以使用html5.js库。
  • 给img标签加alt属性
  • 给a标签添加title属性
  • 给外部网站的a标签添加rel="nofollow"属性,告诉蜘蛛不要往下走了,不然可能回不来了。
  • br标签只能在p标签等表示段落文本的标签内使用,不要使用br来排版
  • 正文标题使用h1标签,副标题使用h2标签,样式用css控制
  • 给table表格加caption标签,用来给表格指定标题
  • 不要使用iframe框架
  • 如果内容很重要不要使用display:none隐藏,使用z-index代替
  • 给分页条尾页,下拉页等
  • 重要内容写在前面,广告等内容写后面,重要内容不要使用js输出

4.url规范化

    http://www.harrytse.com?from=wechat
    http://www.harrytse.com?from=weibo
    http://www.harrytse.com?from=qq

可以看到上面三个链接都是同一个页面,只是用get参数区分不同的来源,可以在head上加上canoical表示页面唯一。

<link rel="cononical" href="//:ke.qq.com/download/download/app.html" />

5.相关工具

google robots.txt测试工具

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

1 participant