帖子标记 ‘Optimize’

robots.txt 必须放置在一个站点的根目录下,而且文件名必须全部小写。

Robots.txt是用来告诉bot的访问权限,因Robots.txt协议并 不是一个规范,而只是约定俗成的,通常大多数搜索引擎会识别这个元数据,不索引这个页面,以及这个页面的链出页面,使用方法是将robots.txt文件 放在网站根目录下。举例来说,当搜索引擎访问一个网站(比如我想网)时,通常首先会检查该网站中是否存在robots.txt这个文件, 如果机器人找到这个文件,它就会根据这个文件的内容,来确定它访问权限的范围。闲话不扯了,进入正题:

经本人的试验,对于一个遵守 Robots.txt协议的蜘蛛,如果你修改Robots.txt过于频繁,可直接导致将你的站“冷”处理!本人的站就已进入该黑洞了,之前百由于不想让 百度蜘蛛收录商品列表的老页面,就直接B了百度蜘蛛访问此页,过了约3天,效果果真明显,小CO还暗喜这蜘蛛真听话,于是乎又想到网站内之前使用的几个页 面。现在也用不上了,而此前已被搜索引擎收录了N多页,现在一起B了,于是修改了Robots.txt,这一改不要紧,两于过去了,小CO再也高兴不起来 了,可爱的百度蜘蛛再也不哪么勤快了(之前每天在站内爬2万以上),现在几天也不到2万,晕死。上了当就得找原因:上边说过了,一旦B了某个页面,蜘蛛就 不索引这个页面,以及这个页面的链出页面,偶的就中了这个奖了!很多人放出了他们自己修改的robots.txt文件,但都忽略了百度蜘蛛的爬行规律:并 不是进入一个版块后,就按照人类思维,按文章列表顺序爬行的,我从自己的站点,已经证实这个问题:

比如文章列表第一篇爬完后,并不是接 着爬第二篇,而是从第一个篇内容页中的“热点文章”等继续爬(这就要求站内的贯通性较好!)。从DZ官站的收录页URL就可以看出这个点,如果随意屏蔽 /forum.php?mod=redirect* 或者/forum-redirect*这样的路径,可能会导致大部分网页不被收录。

不要用人的思维习惯来判断蜘蛛程序的规律。很多站长放了robots.txt后,就发现百度很少收录自己的内页,很可能就是这个原因。所以用 robots.txt文件来解决重复收录问题,是很危险的,从程序上做根本解决才是上策!小CO是上当了。希望有问题的朋友慎用robots.txt!
(全文 …)

torbit 我想网

谁都知道速度对一个网站来说非常重要,并且Google还把网站的加载时间作为网站排名依据之一。

通过雅虎的YSlow插件或Google的Web Accelerator你可以学到很多网站加速知识,但具体实施起来要看你的网站怎样,以及你手头的资源。

Torbit是 一家刚成立的创业公司,他们的目的是让网站优化变得更加简单,让网站站长得到彻底解放。他们称自己的服务在理想的状态下可以让网站加载速度翻番。

影响网站加载速度的主要 因素包括:没有压缩的图片,过多没必要的http资源请求,含有过多空白行的前端代码,没有合并的文件,以及网页上脚本的加载顺序和CDN等。

有了Torbit,站长只需在 自己的DNS记录里面添加一条A记录,然后其它的事情交给Torbit去做。

Torbit在亚马逊EC2基础上开发,但打算未来支持更多提供商。

一般网站的平均转化率在3%左右,但很多网站能达到10%或更高。他们是怎么做到的呢?你错过了什么?

纽约时报畅销书作家Bryan Eisenberg在一次个人演讲中揭示了高转化率网站的秘密和实现方法。以下是他演讲的概要。

转化率究竟是什么?从根本上来说,转化率是衡量你说服访问者进行你预想行动的能力。它反映了你的营销效果和客户满意度。
为了实现你的营销目标,访问者首先需要实现他们的目标。

低于10%的转化率都是不尽人意的。很多顶级零售商的转化率每月都高于15%。他们是怎么做到的呢?你错过了什么?
(全文 …)

自Google宣布页面的加载速度会影响PageRank算法以来,虽然大概只占1%,想尽方法来优化您的网站或者博客依然是非常好的选择。

以下10个免费的工具是可以为您测试网站速度并因此而提供各种建议,从中您会找到您的网站速度比较慢的原因并采取措施如果去提升性能。

1. Page Speed

Test Website Speed

Google 的 Page Speed 是一款开源的,基于Firefox浏览器外接附件,您可以用它来测试当前的网页并获取信息如何来提升页面加载速度。

在使用Page Speed前,您还需要添加Firefox的另一款外接附件Firebug。

访问 Page Speed
(全文 …)

追溯到前三个月,如果你访问RIA之家,将是痛苦的经历,打开一个首页需要高达25秒的时间!那时候很多朋友向明河抱怨RIA之家实在是慢到令人发 指,而如今RIA之家的访问时间已经是5秒,明显快了非常多(5秒其实还是不够快)。

今天这篇文章,明河以优化RIA之家性能为例讲述如何优化WordPress站点。

一、准备

1、YShow :web性能优化必备工具。

2、测速站点:http://tools.pingdom.com/

3、合并背景图片 :http://www.csssprites.com/
(全文 …)

本文讲的是WordPress的标题 title和meta标签(Description和keywords)的优化。虽然google等搜索引擎给meta标签优化的权重并没有以前那么高了,但设置了总比没有设置好,同时描述语Description会出现在搜索引擎的搜索结果中,对提高用户体验也会很有 帮助。yahoo搜索引擎给keywords标签的权重还是可以的。

下面结合 , 给首页和文章页等不同页面设置不同的标题(title)、描述语(Description)及关键词(keywords)。

打开模板theme主题中的header.php文件。
(全文 …)

通过对WordPress博客系统的动态网页通过url rewrite重写,生成了含有永久固定链接的文章、分类和标签等伪静态页面之后,同一个页面就至少会有2个URL地址同时指向它,比如本文就可以通过(http://www.iwanna.cn/archives/2010/05/27/3499/)和(http://www.iwanna.cn/?p=3499)这两个不同的超级链接打开。这就造成了被搜索引擎所鄙视的重复页面,显然存在URL 规范化的问题。

Google官方博客早期发表了一篇url 范式指南:指定您的URL范式, 通过使用rel=”canonical”属性,就可以解决不同网址带来的网页重复问题。
(全文 …)

URL网址规范化方法

作者: seasun

什么是网址 url 规范化(URL canonicalization)?

url 网址规范化指的是当出现了有大于一个的链接指向含有相同内容的网页时,通过各种方法让搜索引擎只挑选其 中一个最喜欢的的网址,同时告诉搜索引擎不收录和索引其他网址的过程,从搜索引擎的角度上说,url 规范化减少了对一个网站的重复页面的索引。网站重复页面问题也是搜索引擎优化()中很多人关注的一部分。url 网址规范化是一个将url进行标准化的过程,Google 中文官方博客 建议我们指定 url 范式

什么是不规范的url 网址?

下面我们看看存在 url 网址规范化问题的例子:

  • www开头和不带www的域名不分,如顶级域名www.a.com 和a.com;子域名www.a.b.com和a.b.com;
  • 动态页面网址和静态页面网址:如http://www.iwanna.cn/archives/2010/05/27/3497/ 和http://www.iwanna.cn/?p=3497
  • 网址含有多余的部分:如含默认端口号:80;含有多余的默认文件名default.php, index.html等;含有多余的”/”;
  • 数据库空查询;无效的查询变量;
  • 使用IP地址代替域名网址;
  • 大小写不分:http://www.abc.cn/ABOUT.php 和 http://www.abc.cn/about.php;

(全文 …)

好的搜索引擎等级可以给你的站点带来更多的“有机”访问。如果你在使用Wordpress,不必担心,它已经帮你把最困难的部分搞定了。但还有一些没在Wordpress核心中实现的SEO特性,你可以很容易地通过安装插件达到目的。
具体需要安装多少插件来达到更好的搜索引擎评级呢?那就看你自己的喜好了,但是请尽量控制插件数量免得让你的服务器崩溃。 今天我们来说说10款提高PR值(搜索引擎排名)的WordPress插件
1. All in One Pack
这款插件对Wordpress的某些部分进行修改来达到SEO的效果。比如,你可以自定义单篇文章的标题,描述和标签。 另外,该插件后还有一些自动为Wordpress站点生成Cononical地址以及是否索引存档页面的特性。

2. Broken Link Checker
这个插件可监控站点无效的内链与外链以及任何无效图片。 为什么说这个插件是一个必备插件呢,因为如果你写了一篇有链接指向 www.domain.com 的文章,但是这个链接可能在以后失效,其结果是给搜索引擎留下了一个死胡同,这对于SEO是很不利的。通过这个插件你可以立即收到相关提醒并移除这些失效 链接。
(全文 …)

HTML优化

作者: seasun

在前端领域中,对Javascript和CSS的优化一直是大家关注的焦点,相应的压缩优化工具也非常丰富,相对而言对HTML优化的关注则显得有些冷淡。在Steve Souders的大作《Even Faster Sites》中谈到非常多有效的前端优化方法,例如Javascript的加载、CSS选择符、图片优化、gzip、iframe问题等,唯独没有细说 HTML优化。在整个前端的构成中,HTML是必不可少的一部分,而且是真正的展示“前端”。虽然与动辄十几K的Javascript相比,HTML的大 小在整个页面资源中一般不会占太多的比重,而且还有Gzip,但是事实表明,大多数页面都有较大的压缩余地,即使是Gzip过后仍然能减小可观的体积,这 一事实在后续的文章中会给出,本文主要讨论HTML优化的一些可行和看上去不那么可行的途径。

对于各种优化途径,如果一定要我给一个分类的话,我会用颜色来区分。对于那些在各种页面中都适用而且无害的方法,我将它们归为绿 色。相对而言,只有在某些具体的情况下才适用或者有违标准的方法归为橙色

绿色方法

1. 使用相对URL

对于页面中的各种URL,例如链接、外链CSS的href、外链Javascript的src、图片src、iframe src等,如果能够确定它们与当前页面是处于同一域名下的话,则可以使用相对URL,这样每一个URL都能够节省至少一个域名的长度。

2. 删除HTTP或HTTPS

绝对URL都以HTTP或HTTPS等协议头开始,如果能确定URL的协议与当前页面URL的协议是一致的,或者说该URL在多种协议下均 是可用的,则可以考虑删除这个协议头。这样做虽然有些非主流,但事实证明是可行的,而且也有理论依据(见http://www.ietf.org/rfc/rfc2396.txt 第5.2节描述)。Nexus One的这个页面中有些资源URL就删除了协议头,虽然并不是出于节省资源的目的,但至少证明删除协议头是可行的。

对于CSS,如果删除协议头在IE7、IE8下会造成CSS下载两次,这个是需要注意的问题。
(全文 …)