Author Archive
网页减肥-CSS 样式
网页制作应通过 CSS(层叠样式表单)来统一定制字体风格。例如:
<b style=”color:red;font-size:16px;”>测试</b>
<div id=”divmain” style=”font-size:12px;”>DIV</b>
<div style=”color:red;”> 红色 <b style=”color:green;”>绿色</b> </div>
———————-
<style type=”text/css”>
b { color:red;font-size:16px; } /*通用对象*/
#divmain {font-size:12px;} /* ID 对象 */
.red {color:red;}/* 定制类别 */
.red b {color:green;}/* 定制类别下的通用对象*/
</style>
<b>测试</b>
<div id=”divmain”>DIV</b>
<div class=”red”> 红色 <b>绿色</b> </div>
CSS 减肥示例文件把文字的字体、字号、颜色、背景色等统一起来,不用对每段文字单独进行
格式定义,从而减少大量重复性标签。注意把所有 css 文件单独存放在命名为 css 的外部文件
中。
语法: <link rel=”stylesheet” type=”text/css” href=”/common/client.css”>
作用的优先级:自身的style属性 > 页面的内部style对象 > 页面外部css文件。
网页减肥
代码设置不妥不仅延长网页加载时间,也严重影响爬虫程序对网页内容的抓取。通过对网页代
码进行清减去掉臃肿杂乱的代码,减小网页文件大小,能够加快网页加载速度,让爬虫快速索引到
重要内容。整个网页最好不要超过30K,文字内容最好5K-10K 之间,谷歌 只对内容的前5000 个
字进行索引。
我的淘客站点之收录心得
在阿里妈妈里面,发表了top收录超过3万的文章,有网友问我可有秘籍,我哪有啥子秘籍哟,在这里就把我的一些这段时间的心得和兄弟们分享下,个人觉得菜鸟倒是可以看看。
首先咱们是个淘客站点,收录到15万的我到是见过,据说还有淘客站点收录到150w的,我是没有见过的,不晓得可存在?
收录和淘客站点的类型也是有些关系的,一般有纯粹top版本的,还有带文章发表类的,还有论坛,以及能和游客互动的类型。后者当然是要站一定优势的,很显然在同等条件下,引擎更喜欢后者。但是互动和带论坛以及大型文章发布系统的淘客站,不是人人都可掌握的,或者说管理。鉴于此,大部分的淘客兄弟们选择的是top版本。这个在收录方面多少有点吃亏。
很多nb的兄弟们,都把自己的站点做成静态的,伪静态的,以利于引擎的收录,而事实上动态的收录方面也是不错的。所以这里面就有一个网站推广的问题。在同等的条件下,静态的还是要胜出一筹。
因此,我认为兄弟们可把时间精力花在推广上面,而不是花在什么优化啊,找一些免费的源码啊,这样只是在浪费时间罢了。 我们应该有空的话多发些文章啊,帖子啊,找一些链接啊,外链接不在多,要质量好。不要强求写多少,这是一个持久战,不然很累的,时间长了权重搞了,收录会很快的,还有就是首页不要经常动,我发现动作多了,首页回档。 一般周三或者周四百度会有更新,pagerank大慨3个月更新一次,快照一般在第二个月,所以要在这一段时间,做好更新的准备,这期间多更新些内容,帖子就在天涯,sina,百度上发表,实践证明很是有效。我们可以在二月份中旬做大量的更新,坚持到月底或者3月初,等到3月底pagerank更新时间,我们的权重会更上一层楼。追求单纯的pagerank也是不可取的,那样没有啥子意义。
做好这个,权重一定会提高,排名会有所靠前,收录也会多起来。流量在1000-2000就不要放广告了吧,那样一来没有多大的收益,据说还影响百度收录。
淘客之路,酸甜苦辣的滋味,不是有你选的,而是要你来偿的。这是一条漫长的道路,消极的不要,悄悄的赚钱即可,你要知道我在写这篇文章的时候,有人的pid账户正在进账。原创www.cnseoblog.com转载注明出处。
SEO其实没有那么神秘
不知道什么时候开始,在互联网上就兴起了SEO热潮,一直持续到现在。很多人都知道SEO就是搜索引擎优化,那么在SEO这项工作是否真的像很多人认为的那样神秘呢?
很多一些网络公司的人说,他们给网站做过优化以后,就可以使网站排在第一位。而且是100%保证可以的。我就纳闷啊,有这么牛吗?其实并不是这样,跟大家说说我的亲身经历。
09年的时候,我去听了一个关于《网络营销》相关的讲座,进去的时候,才发现里面有大部分都是他们自己人。台上演讲的是XXX威客类网站的CEO,他拿出几个他们优化过的网站来举例子,我就认真的看着。
发现他们所谓的关键优化,就是将关键的字的范围缩小再缩小,这样的搜索出来的关键字,不排第一才怪啊。如果说让他们优化一个大范围的关键字,估计他们也没办法了。也不敢打这样的包票了。
其实我个人认为,SEO重点就是在一定程度上优化了网站以后,怎样去经营,这是一个过程。网站关键字优化也只能搞寻找小范围内的相关网站的关键字,这样网站才有可能出现在搜索引擎的好位置。每天搜索的人很多,每天用不同关键字搜索同一个信息的人也很多,他们就希望通过准确的关键字来找到准确的信息。所以,SEO关键词优化中,关键词的选择也是很重要的。
最后,SEO并非所有关键字都可以排第一名,网络公司打着100%包票,其实也就是忽悠外行人。所以只要你选择对的关键字,好好的经营网站,多交换质量高的友情链接,那么排第一并不是什么问题。
什么叫质量高的友情链接呢?1.网站原创内容多。2.经常有更新。这样的网站,觉得是搜索引擎喜欢的,你跟他们交上朋友,搜索引擎也会喜欢你的。
拿我自己的博客来举个例子吧,我的博客叫“ET搜索引擎优化(http://etseo.com)”这个次词,在搜索引擎中不多,也不少。有好几万条吧,同名的网站也是存在的。可是在搜索中进行搜索“ET搜索引擎优化”的时候,前段时间我的博客只会出现在第二页,甚至更后面。但是经过半个月的链接交换,现在我去搜索,我的博客就出现在第一位了。
栏目页优化
1. 关键词选择
栏目页的关键词,相对首页,可以选择次一些的关键词,以核心“SEO”为例,栏目也可以是“SEO
培训”,“SEO 教程”等。
2. 内部链接
栏目页一定要链接到首页,为首页建立内部链接。同时和其他栏目页也要相互链接。
栏目页大量的链接内容页,链接数量控制在 100 个以内。
内页优化
1. 关键词
内页可以不特别关注关键词,可以将 Meta 标题 设置成相同的内容。在页面里更多的利用H1,
IMG、STRONG 标签优化关键词。
2. 内容
网页要以内容为主,大于5K 时,可以做翻页处理。内容最好是原创,内页收录的越多,从搜索
引擎来的流量才能越多。
3. 链接
通常内页很少有外部链接的,除非内容非常好,被人转载。内页要链接栏目页和首页,大量的
内页链接,有利于栏目页和首页的关键词排名。内页最好能链接内容相关的其他内页,这样可
以增加网页的相关度,同时方便用户浏览,增加网站的PV。
User-agent
该项的值用于描述搜索引擎robot 的名字,在”robots.txt”文件中,如果有多条User-agent 记录说
明有多个robot 会受到该协议的限制,对该文件来说,至少要有一条User-agent 记录。如果该项的值
设为*,则该协议对任何机器人均有效,在”robots.txt”文件中,”User-agent:*”这样的记录只能有一条。
Disallow
该项的值用于描述不希望被访问到的一个URL,这个URL 可以是一条完整的路径,也可以是
部分的,任何以Disallow 开头的URL 均不会被robot 访问到。例如”Disallow:/help”对/help.html 和
/help/index.html 都不允许搜索引擎访问,而”Disallow:/help/”则允许robot 访问/help.html,而不能访问
/help/index.html。任何一条Disallow 记录为空,说明该网站的所有部分都允许被访问,在”/robots.txt”
文件中,至少要有一条Disallow 记录。如果”/robots.txt”是一个空文件,则对于所有的搜索引擎robot,
该网站都是开放的。
Optimise your website with keywords
Everyone wishes his website rank in front among the search result for a particular keyword,that’s why all bloggers do . Each website has its own worth. This worth is designated to it by the search engines.Keyword optimization means enhancing your website in various aspects to obtain a good website rank.They take into consideration various features of a website before giving it a worth. The search engine methods are updated often and they’re rivalling with every other to give pagerankecise outcomes.they’re continuously upgrading their crawlers and enhancing the outcomes.
To optimize your website,you should choose possible which describe what’s the site about.Once we have our list of 3 to 4 , we need to go to and check out the competition to see exactly how hard it will be to optimize for the specified keyword.Seeing that the website for this keyword only has a Page Rank of 3 or 4 is also good news for us, because a Page Rank of 4 should be easy to obtain.If we go to and enter “Cheap Rugs“, you’ll see there are almost 10 million websites competing for this keyword phrase!So,what to do if you you also want your keyword “Cheap Rugs” or “Area Rugs“to be shown in the first page of the search result?Well,pagerankoblem solved if you have high pagerank.
The most efficient way to increase the pagerank of your website is to get other websites with high and long-time living sites to link to yours.Body and text optimization in a website is also one of the elements that search engine robots consider when scanning a web page and also a key factor to your web page’s ranking.Besides,it is tight with the optimization of your web page.The human eye likes organization and direction just as search engines do. If your web page is formatted in a way that search engine can easily red then it will be recnseoblogble by actual persons as well! If you find that you are introducing a new topic that is not related to one of your “Rugs“, then put this information on a new page. The more pages available to optimize, the greater the opportunity there is for your site to rank for a keyword phrase in a search engine.
One more thing is that the crawlers and do not read images, colours or text in an image; they only read the code behind that image. When you place an image in HTML make sure you to enter relevant text for the and alt tags. Finally, if you have broken images that fail to display on your page, then you might want to remove them or fix them,because it’s not frienly to search engines.
“Allow”扩展名
谷歌bot 可识别称为”Allow”的 robots.txt 标准扩展名。其他搜索引擎的漫游器可能无法识别此
扩展名,因此请使用您感兴趣的其他搜索引擎进行查找。”Allow”行的作用原理完全与”Disallow”
行一样。只需列出您要允许的目录或页面即可。
您也可以同时使用”Disallow”和”Allow”。例如,要拦截子目录中某个页面之外的其他所有页面,
可以使用下列条目:
User-Agent:谷歌bot
Disallow:/folder1/
Allow:/folder1/myfile.html
这些条目将拦截 folder1 目录内除 myfile.html 之外的所有页面。
如果您要拦截 谷歌bot 并允许 谷歌 的另一个漫游器(如 谷歌bot-Mobile),可使用
“Allow”规则允许该漫游器的访问。例如:
User-agent:谷歌bot
Disallow:/
User-agent:谷歌bot-Mobile
Allow:
使用 * 号匹配字符序列
您可使用星号 (*) 来匹配字符序列。例如,要拦截对所有以 pagerankivate 开头的子目录的访问,可使
用下列条目:
User-Agent:谷歌bot
Disallow:/pagerankivate*/
要拦截对所有包含问号 (?) 的网址的访问,可使用下列条目:
User-agent:*
Disallow:/*?*
使用 $ 匹配网址的结束字符
您可使用 $ 字符指定与网址的结束字符进行匹配。例如,要拦截以 .asp 结尾的网址,可使用
下列条目:
User-Agent:谷歌bot
Disallow:/*.asp$
您可将此模式匹配与 Allow 指令配合使用。例如,如果 ? 表示一个会话 ID,您可排除所有包含该 ID 的网址,确保 谷歌bot 不会抓取重复的网页。但是,以 ? 结尾的网址可能是您要包
含的网页版本。在此情况下,可对 robots.txt 文件进行如下设置:
User-agent:*
Allow:/*?$
Disallow:/*?
Disallow:/ *?一行将拦截包含 ? 的网址(具体而言,它将拦截所有以您的域名开头、后接任意字
符串,然后是问号 (?),而后又是任意字符串的网址)。
Allow: /*?$ 一行将允许包含任何以 ? 结尾的网址(具体而言,它将允许包含所有以您的域名开
头、后接任意字符串,然后是问号 (?),问号之后没有任何字符的网址)。
Robots.txt 带来的好处
1. 几乎所有的搜索引擎 爬虫 都遵循robots.txt 给出的爬行规则,协议规定搜索引擎爬虫 进
入某个网站的入口即是该网站的robots.txt,当然,前提是该网站存在此文件。对于没有配置
robots.txt 的网站,爬虫 将会被重定向至404 错误页面,相关研究表明,如果网站采用了自
定义的404 错误页面,那么爬虫 将会把其视作robots.txt——虽然其并非一个纯粹的文本文
件——这将给爬虫 索引网站带来很大的困扰,影响搜索引擎对网站页面的收录。
2. robots.txt 可以制止不必要的搜索引擎占用服务器的宝贵带宽,如email retrievers,这类搜索
引擎对大多数网站是没有意义的;再如image strippers,对于大多数非图形类网站来说其也
没有太大意义,但却耗用大量带宽。
3. robots.txt 可以制止搜索引擎对非公开页面的爬行与索引,如网站的后台程序、管理程序,事
实上,对于某些在运行中产生临时页面的网站来说,如果未配置robots.txt,搜索引擎甚至会
索引那些临时文件。
4. 对于内容丰富、存在很多页面的网站来说,配置 robots.txt 的意义更为重大,因为很多时候
其会遭遇到搜索引擎爬虫 给予网站的巨大压力:洪水般的爬虫 访问,如果不加控制,甚
至会影响网站的正常访问。
5. 同样地,如果网站内存在重复内容,使用robots.txt 限制部分页面不被搜索引擎索引和收录,
可以避免网站受到搜索引擎关于 duplicate content 的惩罚,保证网站的排名不受影响。
robots.txt 带来的风险及解决
1. 凡事有利必有弊,robots.txt 同时也带来了一定的风险:其也给攻击者指明了网站的目录结构
和私密数据所在的位置。虽然在Web 服务器的安全措施配置得当的前提下这不是一个严重的问题,但毕竟降低了那些不怀好意者的攻击难度。
比如说,如果网站中的私密数据通过www.etseo.com/pagerankivate/index.html 访问,那
么,在robots.txt 的设置可能如下:
User-agent: *
Disallow: /pagerankivate/
这样,攻击者只需看一下robots.txt 即可知你要隐藏的内容在哪里,在浏览器中输入
www.etseo.com/pagerankivate/ 便可访问我们不欲公开的内容。对这种情况,一般采取如下的
办法:
设置访问权限,对/pagerankivate/中的内容实施密码保护,这样,攻击者便无从进入。
另一种办法是将缺省的目录主文件 index.html 更名为其他,比如说abc-pagerankotect.html,这样,
该内容的地址即变成www.etseo.com/pagerankivate/abc-pagerankotect.htm,同时,制作一个新的
index.html 文件,内容大致为“你没有权限访问此页”之类,这样,攻击者因不知实际的文
件名而无法访问私密内容。
2. 如果设置不对,将导致搜索引擎将索引的数据全部删除。
User-agent: *
Disallow: /
上述代码将禁止所有的搜索引擎索引数据。
网页相似度
网页相似度是比较网页是否相似,通常有以下两种计算方式:
1. 根据网页摘要来比较,如果多个网页摘要的 md5 值一样,证明这些网页有很高的相似性
2. 根据网页出现关键词,按照词频排序,可以取N 个词频高的,如果md5 值一样,证明这些网页
有很高的相似性。
网页相似度对SEO 的影响:
谷歌 对网页相似度限制在60%,如果超过这个标准将导致页面不被收录,或者收录后排名靠后中。
相关服务器返回代码介绍
200 客户端请求已成功响应。
301 永久重定向某个链接。
302 临时重定向到某个链接。
404 访问的页面暂时不存在。
当网站进行调整、页面进行修改的时候,便会有网页被删除、改名或移动位置,这时候,虽然
相应内容的网页还存在于网站中,但使用原来的地址访问则无法访问,或者由于拼写错误导致一个
无效的链接,都将使服务器返回 404 状态码。
但是,Web 服务器默认的404 错误页面,均十分简陋、呆板且对用户不友好,无法给予用户寻
找相应信息的更多线索,用户看到这类页面往往最直接的反应并是关闭浏览器窗口离开,这在很大
程度上给网站造成损失。毕竟,对网站来说,用户永远是最重要的资源,以这种方式损失用户更意
味着某种程度的失败。
这也是许多网站使用自定义 404 错误页面的原因。通过良好的自定义404 页面,可以包含对网
站的相应介绍、用户可能感兴趣的内容链接或者网站内容导航链接、内容搜索功能等,能够有效地
帮助访问者找到其欲寻找的内容或相似的内容,提高用户在网站内浏览更多信息的机会。
正确定义 404 错误页面
1. 对于已经存在的信息由于路径改变而导致访问不了时,应该在IIS 中定义404 错误指向一个动
态页面,在页面里面使用301 跳转到新的地址,此时服务器返回301 状态码。
2. 当访问一个错误的链接时,将调用404 页面,但由于在IIS 里面设置的不同将导致返回不同的
状态码:
1. 404 指向的是一个htm 文件,此时页面返回的404 状态码,这是正确的。
2. 404 指向的是一个URL,例如 /error.asp,如果不在页面里面进行设置,仅仅是返回提示
的HTML 代码,将导致页面返回200 状态码,此时的危害在于,当很多页面找不到时,
都返回和访问正常页面时返回一样的200 状态码,将使搜索引擎认为该链接存在,并以
错误页面的内容进行收录,当这样的链接很多时,将导致大量页面重复,使网站排名降
低。处理方法:在显示完提示内容后,增加语句: Response.Status=”404 Not Found” ,
这样就保证页面返回404 状态码。
3. 避免在调用 404 页面的时候返回302 状态码,容易被搜索引擎认为是重定向作弊。
4. 检测方法,使用 HttpWatch 查看返回代码。参见:
在这个例子中,我请求的是http://www.rkseo.com/1223.html ,新浪返回错误页面,然后5 秒
钟后,使用js跳转到首页。
搜索引擎优化的重点:链接策略
对于简单的关键词,只要做页面内部优化就可以排名上去,对难度大的关键词,就需要依靠链接策
略了。
导入链接
搜索引擎在决定一个网站的排名时,不仅要对网页内容和结构进行分析,还围绕网站的链接展
开分析。对网站排名致关重要的影响因素是获得尽可能多的高质量外部链接,也称导入链接。
将导入链接纳入排名重要指标的依据在于,搜索引擎认为,如果你的网站富有价值,其它网站
会提及你;对你提及越多,说明价值越大。由此引申出链接广度(链接 Popularity)在搜索引擎优化
中的重要地位。
当然了,既然导入链接有这么大作用,人们想方设法地为网站“制造”外部链接,导致涌出大
量垃圾(spam)链接。这也就是以前优化就是在论坛发贴的原因。
高质量导入链接
1.搜索引擎目录中的链接以及已加入目录的网站的链接。
加入搜索引擎目录,说明这个链接被搜索引擎认可。
2.与你的主题相关或互补的网站。
说明你的网站是专门做这方面的,比如ET搜索引擎优化链接ET搜索引擎优化。
3.pagerank 值不低于 4 的网站。
pagerank 值为4 的网站很容易做到,但是pagerank>4 的网站很难了。百度的pagerank 才是7。
不过谷歌 对英文网站更偏向一点,大部分英文网站的pagerank 值都大于中文的。
4.具有很少导出链接的网站。
导出链接只有5 个的网站比导出链接30 个的网站,对你的网站的加分贡献要高。
例如一个网站pagerank 值为10,有5 个外链的,每个可以分到2,比30 个就高多了。
5.内容质量高的网站,就是原创内容多的网站。
原创内容多的网站是搜索引擎最喜欢的,当然也算是高质量链接了。
获得高质量导入链接
1.向搜索引擎目录提交网站。
2.在重要网站发表专业文章。
围绕目标关键词在一些重要站点发表文章,在文章中或结尾带上你的网站签名。这样也是既
可以获得高质量互惠链接,亦可能获得目标客户。重要网站有博客、行业内流量高,威信度
高的网站。
比如IT技术:zdnet,被他收录的文章会被很多人转载的,页面的pagerank将不会低于4 的。
3.在所在行业目录提交网站。
尽可能向更多的相关网络目录、行业目录、商务目录、黄页提交你的网站,加入企业库。
搜索的方法:目录网站。
4.寻找网站交换链接。
导出链接
导出链接就是你的网站中指向其它网站的链接。
搜索引擎机器人除了分析你的导入链接,也会分析你引出去的站点,如果导出链接站点内容与你的网站主题相关联,同样有利于搜索引擎友好。这也是交换链接要选择主题相关网站的原因。还有个
现象就是由于缺乏原创资料,他们常常转摘其它网站的文章作自己网站的内容,但又不注明来源,
惟恐导出链接助长了竞争对手,不利于自己的网站访问量。其实,对搜索引擎来说,适量、适当的
导出链接是很有必要的。
当然,一个页面的导出链接也不能太多, 谷歌 认为一个页面的最大导出链接数量不应超过 100
个。
内部链接
一个站点的页面之间也往往彼此链接,如一篇文章结束后的“相关文章” 列表,将该网站中同一主题
下的其它文章都链接在内,不仅方便访问者,提高流量,也有利于搜索引擎索引网页,同时多个页
面链接同一个内页,有助于该内页的排名提高。
例如:内链演示中的相关商品。
网站还可以通过建立多个二级域名子站,子站间彼此相链,再一起链回主站,形成一个子站群包围
主站,对提高排名相当有利。
链接的重要性
下面列出链接的重要性,在网站优化的过程中要引起重视:
1. 链接所在的位置,如果链接处于网页的内容位置,则权重高,处于像页脚那样的底部位置,则权
重低。
2. 链接文字的离散性,就是说,如果你的网站的外链全都整齐化一地使用同一种锚文字来描述,那
谷歌 就会怀疑这是人工做出来的链接,所以可能降权。
3. 链接的标题 属性,谷歌 会认为这也是相关的描述,但是这种对于用户可见性不好,相关性肯
定不如直接使用锚文字的高。
4. 链接超过一定的数量。可能不会被谷歌 搜索到,谷歌 官方举的例子是100 个,超过这个数
谷歌 的爬虫就“审美疲劳”了。
5. 链接所在的网站的IP 地址与指向目标相差越大,效果越好,如果是完全一样,那你很可能是同一
台服务器上的网站“近亲结婚”,谷歌 会歧视的哦。
6. 链接所在的页面如果出现与链接锚文字相同、相近的关键字,很好,会提高相关度。
7. 链接所在的页面如果出现在主题相关的网站中,很好,提高相关度。
8. 链接的稳定性,如果你的链接很不稳定,今天出现一万个,明天剩下几十个,那谷歌 就会注
意到了,你很可能在发垃圾链接哦。
9. 链接出现在权威网站,如:.edu 和.gov 这样的网站中,会提高权重。
10. 互惠链接会被极大的降权。
关键字堆砌
:为了增加某个词汇在网页上的出现频率,而故意重复它。例如在 标题,Meta 中。
不好的例子:手机手机手机手机手机手机手机手机手机。
这是很低级的作弊手段,很容易被搜索引擎惩罚。
如果想增加关键词密度,应该这样:
例如手机。
IT 世界手机频道是中国最权威的手机内容网站.提供手机新闻、手机评测、手机拆卸、手机图赏、业
界动态、手机专题、掌上电脑、手机报价、手机行情、手机导购、手机技巧、手机下载、手机评测、
手机图片、手机大全、手机资料、手机饰物、手机论坛等等精彩。
虚假关键词
:通过在META中设置与网站内容无关的关键词,如在标题中设置热门关键词,以达到误导用户
进入网站的目的。
例如:通常这些网页没有内容,只有标题,内容也是标题的重复。
搜索引擎不宜发现,但如果你发现后提交谷歌,这个页面一定会被惩罚。
重定向
使用META 刷新标记、CGI 程序、Java、Javas cript 或其它技术,当用户点击一个链接时,自
动跳到另一个网页。搜索引擎不宜发现,但如果你发现后提交谷歌,这个页面一定会被惩罚。
常用的重定向方法:
<html>
<head>
<%
‘服务器端重定向
response.redirect “http://www.supercss.com/”
%>
<!– 标签 –>
<meta http-equiv=”refresh” content=”10;URL=http://www.baidu.com/”>
<!– 脚本 –>
<script language=”javascript”>
location.href=”http://www.baidu.com“;
</script>
</head>
<body>
<!– 使用Flash –>
<object width=”480″ height=”385″>
<param name=”movie” value=”url.swf?url=http://www.baidu.com”></param>
<embed src=”url.swf?url=http://www.baidu.com” type=”application/x-shockwave-flash”
width=”480″ height=”385″></embed>
</object>
</body>
</html>
包含指向作弊网页的链接
做友情链接时,链接到作弊的网站,特别是在首页链接到作弊网站,将导致网站连带被惩罚。
避免被牵连:
1. 经常性的检查首页友情链接网站是否被搜索引擎惩罚。
2. 将有风险的链接以脚本的方式显示。
例如:<a href=’http://www.superCSS.com’>非常代码网</a>
修改成:document.write(“<a href=’http://www.supercss.com’>非常代码网</a>”);
3. 将友情链接放在 Iframe 页面里面。
4. robots.txt ,禁止所有的搜索引擎访问这些目录。
User-agent: *
Disallow: /links/
5. 针对 谷歌 使用标记说明该页面的链接被忽略:
<meta name=”Robots” content=”index,nofollow” > 页面全部链接都无效
<a rel=”nofollow” > 六合彩 </a> 标记的这个链接无效
隐形文本/链接
为了增加关键字数量,网页中放一段与背景颜色相同的、包含密集关键字的文本,访客看不
到,可搜索引擎却能找到。类似方法还包括超小号文字、文字隐藏层等手段。隐形链接是在隐形文
本的基础上在其它页面添加指向目标优化页的行为。
表现形式:
<font style=”font-size:1px;”>搜索引擎优化</font>
<div style=”display:none;”>
搜索引擎优化
</div>
<font style=”color:white;”>搜索引擎优化</font>
这是很低级的作弊手段,很容易被搜索引擎惩罚。
百度
首先请确认您的网站上已经没有作弊行为,然后请到百度登录吧或发送邮件到spam@baidu.com,
按照下面的内容进行说明,一般在一个月后可以被解除。
您应在申请解除惩罚的邮件中说明以下内容:
请说明您的网站地址
请说明您什么时间发现网站在百度消失的?
请说明您确认使用了何种被百度确认的作弊方法?
好的例子:
百度申请撤销信样例:
尊敬的百度客服:
您好!
首先我自我介绍一下,我是XXXXX的站长,我叫自由幻想,我的网站建
立于09 年的10 月份,最近因为种种原因我把网站上的程序换了一下以后,百度的收录就成0
页,我不知道为什么会这样的,我一直按照百度搜索引擎的里面协议规定的去做的,没有作弊
也没有违反你们的规定,麻烦尊敬客服帮我重新收录一下,非常感谢你们辛勤的工作,最后我
祝百度越办越好!!
自由幻想
2010 年7 月16 日
这位网页在信发出 1 周后,域名被恢复,现在收录达1180 页。
3. 对于无法恢复的域名,最好的办法就是重新注册新的域名。
搜索引擎对作弊的处罚
搜索引擎的惩罚会根据所犯的错误而定,具体显示现象:
1. 关键词排名降低。
2. 长时间不更新网页内容。
3. 收录减少,甚至为 0。
4. 网站 pagerank 值成0。
发现网站被屏蔽后,应查找网站被屏蔽的原因,修改后,向搜索引擎提交申请,请求再次收录:
1. 谷歌
要申请重新加入,请登录谷歌 Sitemap,选择”申请重新加入”链接,然后按照所示步骤操作。
权威指南:http://www.谷歌.com/support/webmasters/bin/answer.py?answer=3etseo43
Google PageRank
pagerank 值,即网页级别
谷歌 对网页级别的描述:“作为组织管理工具,网页级别利用了互联网独特的民主特性及其巨大
的链接结构。实质上, 当从网页 A 链接到网页 B 时,谷歌 就认为“网页 A 投了网页 B 一票”。
谷歌 根据网页的得票数评定其重要性。然而,除了考虑网页得票数(即链接)的纯数量之外,
谷歌 还要分析投票的网页。“重要”的网页所投出的票就会有更高的权重,并且有助于提高其它
网页的“重要性”。
pagerank 值算法原理:
一个网页被多次引用,则它可能是很重要的;
一个网页虽然没有被多次引用,但是被重要的网页引用,则它也可能是很重要的;
一个网页的重要性被平均的传递到它所引用的网页。这种重要的网页称为权威网页。
Google Dance
谷歌 Dance ,即谷歌 数据更新。
谷歌 有 8 个数据中心,共享超过一万台的服务器。一般在每月15-20 号左右升级数据库库。
期间,新的网站被加入,无效网站被删除,对收录网站进行全面深度检索,也可能在这期间调整算
法。由于每次升级都会引起很多网站排名波动,俗称 谷歌 Dance。
谷歌 Dance 对于 SEO 来说,涉及的注意事项如下:
1.网站的提交及更新时间。
在 Dance 期间,新网站被收录的机会增大,因此宜在 Dance 其间提交新网站及加大网站更新力度。
2.静观其变,及时跟进。
由于数据调整有一个过程,Dance 期间的普遍表现是排名波动不稳定,忽上忽下,也可能在这期间
调整排名算法。所以在 Dance 结束后,针对顿觉降结果和竞争对手的排名情况调整自己的优化策
略。
Google SandBox
关于谷歌 沙盒现象,业界众说纷纭。
一种观点:这是谷歌 对于那些刚发布不久就有良好排名的“可疑”站点置于某种屏蔽程序中进行
一段时期的“隔离审查”。待网站表现稳定之后,再解除屏蔽,给予其应得的实际排名和pagerank 值。
这段时长可能延续3 个月左右。
当然,还有一种观点认为:谷歌 为了在搜索结果(SERP)中为用户提供更多新信息,往往给予新
发布的网站更多“关照”,使得新网站暂时获得排名优势;但随着谷歌 数据更新不断加快,这种
对新网站的照顾开始解除,于是该网站排名趋向正常。
无论原因怎样,对待沙盒效应,正确的态度和方法是:保持冷静,当排名在短时间内迅速上升时不
应盲目乐观,因为这是不稳定的表现。应该利用这个有利时机,频繁更新网站内容, 提高内容质量,
获得更多高质量导入链接,增加网站访问量,才能将排名优势一直保持下去。
Google Sitemap
Sitemaps 协议使您能够告知搜索引擎您网站中可供抓取的网址。最简便的方式就是,使用 Sitemaps
协议的 Sitemaps 就是列有某个网站所有网址的 XML 文件。此协议可高度扩展,因此可适用于各
种大小的网站。它还能够使网站管理员提供有关每个网址的其他信息(上次更新的时间、更改的频
率、与网站中其他网址相比它的重要性)以便搜索引擎可以更智能地抓取该网站。
Sitemaps 在用户无法通过可浏览界面访问网站的所有区域时作用尤其明显。(通常,指用户无法通过
追踪链接访问网站的特定页面或区域。)例如,那些只能通过搜索表单才能访问其中某些页面的网站
都会从创建 Sitemaps 并将其提交到搜索引擎中获益。
此文件说明 Sitemaps 文件的格式,并解释您张贴 Sitemaps 文件的位置以便搜索引擎能够检索到。
请注意 Sitemaps 协议补充而不是取代搜索引擎已用来发现网址的基于抓取的机制。通过向搜索引擎
提交一个 Sitemaps(或多个 Sitemaps),可帮助搜索引擎更好地抓取您的网站。
使用此协议并不能保证搜索索引中将包含您的网页。(请注意,使用此协议不会影响 谷歌 对您网
页进行排名的方式。)
什么是 Google 炸弹
谷歌 炸弹(谷歌 Bombing)指的是这样一种情况:
1)数目众多的网页链接指向某一个URL
2)这些链接都使用特定关键词做链接文字
3)被链接的URL 中一般并不包含这个关键词,内容和这个关键词也基本无关
4)达到的效果就是这个被链接的URL 在这个特定关键词下,搜索引擎排名急剧上升,很多时候都
排到第一
谷歌 炸弹大部分都是出于恶作剧,政治目的,做实验等。
谷歌 炸弹的实现是基于搜索引擎排名算法中的两个事实:
1)外部链接是排名的重要因素之一
2)链接文字很多时候比链接数量更重要
所以当有大量包含特定关键词的链接指向某一个网页的时候,这个网页就算没提到这个关键词,排
名也会非常好。
搜索引擎爬行的规律是什么呢?
搜索引擎爬虫第一天来,发现有更新的,会在第二天仍然过来采集,如果连续几天没有更新,爬虫
会增加间隔天数,比如两天来一次,如果仍然没有更新,就变成四天来一次,然后变成八天、十六天,最高可能是三十二天。如果要让爬虫来的很频繁,就要每天更新网站,当然如果爬虫已经将你
的站降低了标准,即每三十二天来一次,你必须连续发三十多天,才能让爬虫逐渐提高到每天来一
次。而且以后要保持每天发贴的习惯。
当然经常不更新并不是一点好处都没有,比如我有个网站天天更新,后来服务器系统坏了,连续两
天当机,这个网站就被搜索引擎屏蔽了。而我另外一个网站,不更新,在07 年春节当机了十五天,
回来后在搜索引擎里面仍然有数据。
Google SandBox
关于谷歌 沙盒现象,业界众说纷纭。
一种观点:这是谷歌 对于那些刚发布不久就有良好排名的“可疑”站点置于某种屏蔽程序中进行
一段时期的“隔离审查”。待网站表现稳定之后,再解除屏蔽,给予其应得的实际排名和pagerank 值。
这段时长可能延续3 个月左右。
当然,还有一种观点认为:谷歌 为了在搜索结果(SERP)中为用户提供更多新信息,往往给予新
发布的网站更多“关照”,使得新网站暂时获得排名优势;但随着谷歌 数据更新不断加快,这种
对新网站的照顾开始解除,于是该网站排名趋向正常。
无论原因怎样,对待沙盒效应,正确的态度和方法是:保持冷静,当排名在短时间内迅速上升时不
应盲目乐观,因为这是不稳定的表现。应该利用这个有利时机,频繁更新网站内容, 提高内容质量,
获得更多高质量导入链接,增加网站访问量,才能将排名优势一直保持下去。
Florida Update 佛罗里达更新
谷歌 开始的对排名算法的剧烈更新。这个更新,犹如飓风,席卷
了许多网站原先的排名,使很多网站在即将到来的圣诞节的购物黄金季节失去大量的客源。
这个被称为 Florida Update 的大规模调整,是谷歌 反击Black hatSEO 制作垃圾网站来获取不
合法的排名的历史性战役。持续若干月的这个更新,使许多SEO 从业者反思如何正确地使
用技术来减少这种灾难似的打击。
图像优化
一般而言,搜索引擎只识读文本内容,对图像是不可见的。同时,图像文件直接延缓页面加载时间,如果超过20秒网站还不能加载,用户和搜索引擎极有可能离开你的网站。因此,除非你的网站内容是图片为主,比如游戏站点或者图片至关重要,否则尽量避免使用大图片,更不要采用纯图像制作网页(SPLASH PAGE)。
网站图片优化的核心有两点:增加搜索引擎可见的文本描述,以及在保持图像质量的情况下尽量压缩图像的文件大小。
Alt属性:
每个图像<IMG>标签中都有ALT属性,搜索引擎会读取该属性以了解图像的信息。因此,最好在所有插图的ALT属性中都有文字描述,并带上该页关键字在其中。
框架结构
框架结构,即帧结构(Frame)网页表现为一个页面内的某一块保持固定,其它部分信息可以通过滚动条上下或左右移动显示,如左边菜单固定,正文信息可移动,或者顶部导航和LOGO部分保持固定,其它部分上下或左右移动。我们的邮箱通常都采用框架建构。框架型网页的另一个表现是,深层页面的域名通常不会在URL中体现出来,即使进入深层子页面,浏览器显示出来的URL仍然是主页的URL。
框架型网站的优越性体现在页面的整体一致性和更新方便上。尤其对于那些大型网站而言,框架结构的使用可以使网站的维护变得相对容易。但框架对搜索引擎来说是一个很大的问题,这是由于大多数搜索引擎都无法识别框架,也没有什么兴趣去抓取框架中的内容。此外,某些浏览器也不支持框架页面。
如果网页已经使用了框架,或出于某种原因一定要使用框架结构,则必须在代码中使用“Noframes”标签进行优化,把Noframe标签看做是一个普通文本内容的主页。在<Noframe></Noframe>区域中包含指向frame页的链接以及带有关键词的描述文本,同时在框架以外的区域也出现关键词文本。这样,搜索引擎才能够正确索引到框架内的信息。
还有一个办法是采用iframe即内联框架(Inner Frame)技术来避免Frame带来的不便。所谓iframe也是框架的一种形式,它是相当于在主浏览器窗口中内嵌一个子窗口,内容自动打开。iframe可以嵌在网页中的任意部分,也可以随意定义其大小,其代码显示为:
<iframe src=xx width=x height=x scrolling=xx frameborder=x></iframe>”
对搜索引擎来说,iframe中的文字是可见的,也可以跟踪到其中链接指向的页面,不过与用户所见不同的是,搜索引擎将iframe内容看成单独的一个页面内容,与被内嵌的页面无关。
使用网站地图
网站地图(Site Map)是辅助导航的手段,最初是为用户设计,以方便用户快捷到达目标页。良好的网站地图设计常常以网站拓扑结构体现复杂的目录关系,具有静态、直观、扁平、简单的特点。多采用文本链接,不用或少用修饰性图片,以加快页面加载速度。以上特点符合搜索引擎友好的要求,因此网站地图在SEO中也有重要的意义。尤其对于那些采用图片导航和动态技术生成的网页,通过在网站地图中进行文本链接,可在一定程度上弥补爬虫程序无法识别图片和动态网页造成的页面不可见的风险。
需要注意,网站地图也要突出重点,尽量给出主干性内容及链接,而不是所有细枝末节。一页内不适宜放太多链接。谷歌明确提出“如果网站地图上的链接超过大约 100 个,则最好将网站地图拆成多个网页”。
关键字密度
在确定了自己的关键字之后,需要在网页文本中适当出现这些关键字。关键字在网页中出现的频次,即关键字密度 (Keyword Density) ,就是在一个页面中,占所有该页面中总的文字的比例,该指标对搜索引擎的优化起到重要作用。关键字密度一般在 1% 到 7% 较为合适,超过这一标准就有过高或过低之嫌。
切记避免进行关键字堆砌,即一页中关键字的出现不是根据内容的需要而安排,而是为了讨好搜索引擎人为堆积关键字(Stuffing)。这已经被搜索引擎归入恶意行为(Spamming), 有遭到惩罚的危险。
Gif和JPGE图像优化
Alt属性和文本说明都只是对图像之外的文本环境进行优化,下面简单谈谈对图片本身的优化处理。对图片文件优化的目的是在尽量不影响图像画面效果的情况下,将其文件大小降到最低,以加快页面整体下载速度。
网页图片格式主要有GIF和JPGE两种形式。一般来讲,GIF适用于线图和企业标识;JPEG适宜照片元素的格式。主要通过减少GIF颜色数量、缩小图片尺寸和降低分辩率来缩小文件,也可以采用层叠样式表达到优化的目的。PhotoShop的版本越高越适用于网络图形。此外,将大图片切割成若干小图片于不同的表格区间内进行拼接,也可以相对加快下载时间。
文本说明
除了ALT属性文字,还可以考虑以下方法直接优化图像,使之被搜索到:
1、在图片上方或下方加上包含关键词的描述文本;
2、在代码中增加一个包含关键词段的heading标题标签,然后在图片下方增加文字描述。
3、在图片下方或旁边增加如“更多某某”链接,包含关键词。
4、创建一些既吸引用户又吸引搜索引擎的文本内页,先把流量吸引到这些页面,再提供文本链接指向你的图片页面。
总体上,网页应尽量减少装饰性图片以及大图片。而Alt属性中的文字对搜索引擎来说,其重要性比正文内容的文字要低。
图像优化
一般而言,搜索引擎只识读文本内容,对图像是不可见的。同时,图像文件直接延缓页面加载时间,如果超过20秒网站还不能加载,用户和搜索引擎极有可能离开你的网站。因此,除非你的网站内容是图片为主,比如游戏站点或者图片至关重要,否则尽量避免使用大图片,更不要采用纯图像制作网页(SPLASH PAGE)。
网站图片优化的核心有两点:增加搜索引擎可见的文本描述,以及在保持图像质量的情况下尽量压缩图像的文件大小。
框架结构
框架结构,即帧结构(Frame)网页表现为一个页面内的某一块保持固定,其它部分信息可以通过滚动条上下或左右移动显示,如左边菜单固定,正文信息可移动,或者顶部导航和LOGO部分保持固定,其它部分上下或左右移动。我们的邮箱通常都采用框架建构。框架型网页的另一个表现是,深层页面的域名通常不会在URL中体现出来,即使进入深层子页面,浏览器显示出来的URL仍然是主页的URL。
框架型网站的优越性体现在页面的整体一致性和更新方便上。尤其对于那些大型网站而言,框架结构的使用可以使网站的维护变得相对容易。但框架对搜索引擎来说是一个很大的问题,这是由于大多数搜索引擎都无法识别框架,也没有什么兴趣去抓取框架中的内容。此外,某些浏览器也不支持框架页面。
如果网页已经使用了框架,或出于某种原因一定要使用框架结构,则必须在代码中使用“Noframes”标签进行优化,把Noframe标签看做是一个普通文本内容的主页。在<Noframe></Noframe>区域中包含指向frame页的链接以及带有关键词的描述文本,同时在框架以外的区域也出现关键词文本。这样,搜索引擎才能够正确索引到框架内的信息。
还有一个办法是采用iframe即内联框架(Inner Frame)技术来避免Frame带来的不便。所谓iframe也是框架的一种形式,它是相当于在主浏览器窗口中内嵌一个子窗口,内容自动打开。iframe可以嵌在网页中的任意部分,也可以随意定义其大小,其代码显示为:
<iframe src=xx width=x height=x scrolling=xx frameborder=x></iframe>”
对搜索引擎来说,iframe中的文字是可见的,也可以跟踪到其中链接指向的页面,不过与用户所见不同的是,搜索引擎将iframe内容看成单独的一个页面内容,与被内嵌的页面无关。
使用网站地图
网站地图(Site Map)是辅助导航的手段,最初是为用户设计,以方便用户快捷到达目标页。良好的网站地图设计常常以网站拓扑结构体现复杂的目录关系,具有静态、直观、扁平、简单的特点。多采用文本链接,不用或少用修饰性图片,以加快页面加载速度。以上特点符合搜索引擎友好的要求,因此网站地图在SEO中也有重要的意义。尤其对于那些采用图片导航和动态技术生成的网页,通过在网站地图中进行文本链接,可在一定程度上弥补爬虫程序无法识别图片和动态网页造成的页面不可见的风险。
需要注意,网站地图也要突出重点,尽量给出主干性内容及链接,而不是所有细枝末节。一页内不适宜放太多链接。谷歌明确提出“如果网站地图上的链接超过大约 100 个,则最好将网站地图拆成多个网页”。
导航结构
网站导航是对引导用户访问网站的的栏目、菜单、在线帮助、布局结构等形式的统称。其主要功能在于引导用户方便地访问网站内容,是评价网站专业度、可用度的重要指标。同时对搜索引擎也产生诸多提示作用。概括地讲,网站在导航方面应注意以下几点:
1、 主导航醒目清晰
主导航一般体现为一级目录,通过它们用户和爬虫程序都可以层层深入访问到网站所有重要内容。因此主栏目必须在网站首页第一屏的醒目位置体现,并最好采用文本链接而不是图片。
2、 “面包屑型(Breadcrumbs)”路径
所谓“面包屑”是比喻用户通过主导航到目标网页的访问过程中的路径提示,使用户了解所处网站中的位置而不至于迷失“方向”,并方便回到上级页面和起点。路径中的每个栏目最好添加链接
搜索引擎优化基本定义
搜索引擎优化是针对搜索引擎对网页的检索特点,让网站建设各项基本要素适合搜
索引擎的检索原则,从而获得搜索引擎收录尽可能多的网页,并在搜索引擎自然检索结果中
排名靠前,最终达到网站推广的目的.
搜索引擎优化的主要工作是通过了解各类搜索引擎如何抓取互联网页面、如何进行索引
以及如何确定 其对某一特定关键词的搜索结果排名等技术,来对网页内容进行相关的优化,
使其符合用户浏览习惯,在不损害用户体验的情况下提高搜索引擎排名,从而提高网站 访
问量,最终提升网站的销售能力或宣传能力的技术。所谓“针对搜寻引擎优化处理”,是为
了要让网站更容易被搜寻引擎接受。搜寻引擎会将网站彼此间的内容做 一些相关性的资料
比对,然后再由浏览器将这些内容以最快速且接近最完整的方式,呈现给搜寻者。由于不少
研究发现,搜索引擎的用户往往只会留意搜索结果最开 首的几项条目,所以不少商业网站
都希望透过各种形式来干扰搜索引击的排序。当中尤以各种依靠广告维生的网站为甚。目前
SEO 技术被很多目光短浅的人,用一 些SEO 作弊的不正当的手段,牺牲用户体验,一味迎
合搜索引擎的缺陷,来提高排名,这种SEO 方法是不可取的。
搜索引擎优化的定义
WIKI 定义:
(Search Engine Optimization,简称SEO)
搜索引擎优化即Search Engine Optimization,用英文描述是to use some technics to
make your website in the top places in Search Engine when somebody is using Search
Engine to find something,翻译成中文就是“搜索引擎优化”,一般可简称为搜索优化。
与之相关的搜索知识还有Search Engine Marketing(SEO培训网),Search Engine
Positioning(搜索引擎定位)、Search Engine Ranking(搜索引擎排名)等。
SEO 的主要工作是通过了解各类搜索引擎如何抓取互联网页面、如何进行索引以及如
何确定其对某一特定关键词的搜索结果排名等技术,来对网页进行相关的优化,使其提高搜
索引擎排名,从而提高网站访问量,最终提升网站的销售能力或宣传能力的技术。
Sitemaps 索引 XML 标记定义
需要有 <loc> 标记并用其来识别 Sitemaps 的位置。
<lastmod> 标记是可选标记,用于指示相应 Sitemap 文件的修改时间。它并不对应于
该 Sitemap 中列出的任一网页的更改时间。lastmod 标记的值应采用 ETSEO Datetime 格
式。
通过提供最近修改的时间戳启用搜索引擎抓取工具,抓取工具将只检索索引中的
Sitemaps 的一个子集,也就是说,抓取工具只检索某特定日期之后修改的 Sitemaps。
通过这一递增的 Sitemaps 提取机制,可以快速发现超大型网站上的新网址。
<sitemap> 标记封装单个 Sitemaps 的相关信息。
<sitemapindex> 标记会压缩有关文件中的所有 Sitemaps 的信息。
Sitemap 生成器
如果您可以访问网络服务器并且服务器装有 Python,则可以利用我们的脚本来创建采
用 Sitemap 协议的 Sitemap。
谷歌 Sitemap 生成器(后面的章节介绍)是一个 Python 脚本,可以使用 Sitemap 协议为您的网站创建 Sitemap。此脚本可以通过网址列表、网络服务器目录或通过访问日志
创建 Sitemap。要使用此脚本:
1. 您需要连接到您的网络服务器,并在上面运行脚本。
2. 您的网络服务器需安装 Python 2.2 或更高版本。
3. 您需要知道启动 Python 的命令。(该命令通常为 python,但可能会因安装不同
而异。) 例如,如果网络服务器安装了两种版本的 Python,命令 python 可调用
较早的版本,而命令 python2 则可调用较晚的版本。
4. 您需要知道指向贵网站的目录路径。如果您的网络服务器托管一个网站,则路径
可能是 var/www/html 等。如果您拥有一个托管多个网站的虚拟服务器,路径可
能是 home/virtual/site1/fst/var/www/html 等。
5. 您需要能够将文件上传到自己的网络服务器(例如,使用 FTP)。
6. 如果您要根据访问日志生成一个网址列表,则需要了解用于这些日志的编码,以及
指向它们的完整路径。
Sitemap 生成器可以用于生成常规 XML Sitemap。不过,一些特殊种类的 Sitemap(如
代码搜索和视频 Sitemap) 有非常独特的要求。因此,您最好不要使用 Sitemap 生成器
来创建这些 Sitemap。
创建SiteMap
如果您有多个网站,可以创建一个或多个 Sitemap 将所有经过验证网站的网址包含在
其中,然后将这些 Sitemap 保存在一个位置,以此来简化 Sitemap 的创建和提交过程。您
可以通过以下多种方式创建 Sitemap:
1.3.4.1 根据 Sitemap 协议创建 Sitemap:
1. 创建一个文本文件并将其带 .xml 扩展名保存。
2. 将以下内容添加到文件顶部:
<?xml version=”1.0″ encoding=”UTF-8″?>
<urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″>
3. 将以下内容添加到文件底部: </urlset>
4. 为各网址创建一个条目。 <loc> 为必需,其余标记为可选。
<url>
<loc>http://www.example.com/</loc>
<lastmod>2005-01-01</lastmod>
<changefreq>monthly</changefreq>
<pagerankiority>0.8</pagerankiority>
</url>
5. 将 Sitemap 上传到您的网站。然后使用网站管理员工具将其提交给 谷歌。
Sitemaps 文件的位置
Sitemaps 文件的位置决定该 Sitemaps 中所能包含的一组网址。位于
http://example.com/catalog/sitemap.gz 的 Sitemaps 文件可包含以
http://example.com/catalog/ 开始的任何网址,但不能包含以
http://example.com/images/ 开始的网址。
如果您有更改 http://example.org/path/sitemap.gz 的许可,您应该也可以提供以
http://example.org/path/ 作为前缀的网址的信息。
http://example.com/catalog/sitemap.gz 中,被认为有效的示例网址包括:
http://example.com/catalog/show?item=23
http://example.com/catalog/show?item=233&user=3453
http://example.com/catalog/sitemap.gz 中被认为无效的网址包括:
http://example.com/image/show?item=23
http://example.com/image/show?item=233&user=3453
https://example.com/catalog/page1.html
被认定为无效的网址将不再考虑。强烈建议将 Sitemaps 放置在 Web 服务器的根目录
处。例如,如果 Web 服务器位于 example.com,则 Sitemaps 索引文件应位于
http://example.com/sitemap.gz。在某些情况下,您需要针对不同的路径创建对应的
Sitemaps,例如,如果在您的组织中,安全许可对应不同目录划分上传权限。
什么是SiteMap
Sitemaps 协议使你能够告知搜索引擎网站中可供抓取的网址。最简便的方式就是,使
用 Sitemaps 协议的 Sitemaps 就是列有某个网站所有网址的 XML 文件。此协议可高度扩
展,因此可适用于各种大小的网站。它还能够使网站管理员提供有关每个网址的其他信息(上
次更新的时间、更改的频率、与网站中其他网址相比它的重要性等),以便搜索引擎可以更
智能地抓取该网站。
Sitemaps 在用户无法通过可浏览界面访问网站的所有区域时作用尤其明显。(通常,
指用户无法通过追踪链接访问网站的特定页面或区域。)例如,那些只能通过搜索表单才能
访问其中某些页面的网站都会从创建 Sitemaps 并将其提交到搜索引擎中获益。此文件说明
Sitemaps 文件的格式,并解释您张贴 Sitemaps 文件的位置以便搜索引擎能够检索到。
请注意 Sitemaps 协议补充而不是取代搜索引擎已用来发现网址的基于抓取的机制。通
过向搜索引擎提交一个 Sitemaps(或多个 Sitemaps),可帮助搜索引擎更好地抓取您的网
站。
就算已经被谷歌 和Yahoo 收录,也还是有必要用SiteMap 的,这是为什么呢?有以
下两大原因:
a) 用 SiteMap 有利于搜索引擎更加友好的对网站进行收录,不要让网站的收录有些漏
洞或者收录不全。有了SiteMap 可以很好的在这方面发挥作用。
b) 有了 SiteMap 并提交给搜索引擎之后,方便你在以后进行下一步的工作,比如对网站的外部链接和内链错误进行更好的调整,这些都要用到SiteMap 的提交功能。
因此,SiteMap 的整个作用是不容忽视的。如果你的网站属于下列情况,那么,使用
SiteMap 会特别实用:
A. 网站含动态内容。
B. 网站有不容易被发现的页面,如有大量富 AJAX 或 Flash 内容的页面。
C. 网站为新网站且指向网站的链接不多。
D. 网站有大量内容页存档,这些内容页相互没有很好地链接,或根本就没有链接。
E. 网站上网页的更改频率。
F. 各网页上次修改的日期。
G. 您网站上各网页的相对重要性。
如果你的网站出现上面介绍的情况,那么,你就需要创建 SiteMap 了。
如何辨别搜索引擎机器人身份
搜索引擎派出他们的搜索机器人去访问、索引网站内容,网站管理员也默认、欢迎它们
来访。但是由于搜索引擎派机器人来访会在一定程度上影响网站性能,因此并非所有的机器
人都是无害的,有一些非法机器人伪装成主流搜索引擎漫游器对网站大量遍历,并且不遵循
robots.txt规范,会严重拖垮网站性能而又无其它益处。因此,网站管理员需要验证每个机器
人身份是否合法。
在你的服务器日志文件中,可见每次访问的路径和相应的IP地址,如果是机器人来访,
则user-agent会显示谷歌bot或MSNBot等搜索引擎漫游器名称,每个搜索引擎都有自己的
user-agent,但仅有这个还不足以证明这个机器人的合法性,因为很多垃圾制造者可能将他
们的机器人也命名为谷歌bot,以伪装蒙混进入网站,大肆采掘内容。
目前,主流搜索引擎都建议网站管理员通过这种方式来辨别真实的机器人身份:通过
DNS反向查询找出搜索引擎机器人IP地址对应的主机名称;用主机名查找IP地址以确认该主
机名与IP地址匹配。
首先,使用DNS反向查询(Reverse DNS Lookup),找出机器人IP地址对应的主机名称。
主流搜索引擎的主机名称通常情况下应是这样的:
谷歌 : 主机名称应包含于谷歌bot.com 域名中, 如:
crawl-66-249-66-1.谷歌bot.com;
MSN : 主机名称应包含于search.live.com 域名中, 如:livebot-207-46-98-149.search.live.com;
Yahoo:主机名称应包含于inktomisearch.com域名中,如:ab1164.inktomisearch.com。
最后,做一次DNS查询,用主机名查找IP地址(Forward DNS Lookup),以确认该主机
名与IP地址匹配。由此证明该机器人是合法的。
现在,如果发现一个机器人将自己伪装成合法搜索引擎漫游器,你就可以通过服务器上
的设置来阻止这个非法机器人。
探寻蜘蛛和机器人(2)
网络爬虫通过网页的链接地址来寻找网页,从网站某一个页面(通常是首页)开始,
读取网页的内容,找到在网页中的其它链接地址,然后通过这些链接地址寻找下一个网页,
这样一直循环下去,直到把这个网站所有的网页都抓取完为止。如果把整个互联网当成一个网站,那么网络爬虫就可以用这个原理把互联网上所有的网页都抓取下来。
当抓取到这些网页后,由分析索引系统程序对收集回来的网页进行分析,提取相关网页
信息(包括网页所在URL、编码类型、页面内容包含的所有关键词、关键词位置、生成时
间、大小、与其它网页的链接关系等),根据一定的相关度算法进行大量复杂计算,得到每
一个网页针对页面文字中及超链中每一个关键词的相关度(或重要性),然后用这些相关信
息建立网页索引数据库。
建立网页索引数据库后,当用户输入关键词搜索,由搜索系统程序从网页索引数据库中
找到符合该关键词的所有相关网页。因为所有相关网页针对该关键词的相关度早已算好,所
以只需按照现成的相关度数值排序,相关度越高,排名越靠前。
最后,由检索器将搜索结果的链接地址和页面内容摘要等内容组织起来,返回给用户。
探寻蜘蛛和机器人
搜索引擎要知道网上的新生事物,就得派人出去收集,每天都有新的网站产生,每天都
有网站内容的更新,而且这些产生的网站数量、更新的网站内容是爆炸式的,靠人工是不可
能完成这个任务的,所以搜索引擎的发明者就设计了计算机程序,派它们来执行这个任务。
探测器有很多叫法,也叫Crawler(爬行器)、爬虫(爬虫)、robot(机器人)。这些形象的
叫法是描绘搜索引擎派出的爬虫机器人爬行在互联网上探测新的信息,谷歌 把它的探测
器叫做谷歌bot,百度就叫Baidu爬虫,Yahoo 称为Slurp,无论它们叫什么,它们都是人们
编制的计算机程序,由它们不分昼夜的访问各个网站,取回网站的内容、标签、图片等,然
后依照搜索引擎的算法给它们定制索引。
网
搜索引擎的作用
如果非要列举出搜索引擎能做什么,恐怕没有人可以给出完整的答案。现在的网站用户
大部分是通过搜索引擎进入的,如果用户要购买一件商品,他不知道去那家网上的商店去购
买,他就会去搜索,我们的搜索引擎就是满足足用户的这些需求。
我们都知道,现在的互联网上有大量的垃圾信息,而我们的搜索引擎的作用就是将比较
好的网站,和质量高的网站排在页面的前面,这样用户就能很快通过引擎找到他们的东西
了,这应该就是引擎的作用
高质量导入链接
1.搜索引擎目录中的链接以及已加入目录的网站的链接。
加入搜索引擎目录,说明这个链接被搜索引擎认可。
2.与你的主题相关或互补的网站。
说明你的网站是专门做这方面的,比如ET搜索引擎优化链接ET搜索引擎优化。
3.pagerank 值不低于 4 的网站。
pagerank 值为4 的网站很容易做到,但是pagerank>4 的网站很难了。百度的pagerank 才是7。
不过谷歌 对英文网站更偏向一点,大部分英文网站的pagerank 值都大于中文的。
4.具有很少导出链接的网站。
导出链接只有5 个的网站比导出链接30 个的网站,对你的网站的加分贡献要高。
例如一个网站pagerank 值为10,有5 个外链的,每个可以分到2,比30 个就高多了。
5.内容质量高的网站,就是原创内容多的网站。
原创内容多的网站是搜索引擎最喜欢的,当然也算是高质量链接了。
搜索引擎优化的重点:链接策略
对于简单的关键词,只要做页面内部优化就可以排名上去,对难度大的关键词,就需要依靠链接策
略了。
导入链接
搜索引擎在决定一个网站的排名时,不仅要对网页内容和结构进行分析,还围绕网站的链接展
开分析。对网站排名致关重要的影响因素是获得尽可能多的高质量外部链接,也称导入链接。
将导入链接纳入排名重要指标的依据在于,搜索引擎认为,如果你的网站富有价值,其它网站
会提及你;对你提及越多,说明价值越大。由此引申出链接广度(链接 Popularity)在搜索引擎优化
中的重要地位。
当然了,既然导入链接有这么大作用,人们想方设法地为网站“制造”外部链接,导致涌出大
量垃圾(spam)链接。这也就是以前优化就是在论坛发贴的原因。
404 页面
相关服务器返回代码介绍:
200 客户端请求已成功响应。
301 永久重定向某个链接。
302 临时重定向到某个链接。
404 访问的页面暂时不存在。
当网站进行调整、页面进行修改的时候,便会有网页被删除、改名或移动位置,这时候,虽然
相应内容的网页还存在于网站中,但使用原来的地址访问则无法访问,或者由于拼写错误导致一个
无效的链接,都将使服务器返回 404 状态码。
但是,Web 服务器默认的404 错误页面,均十分简陋、呆板且对用户不友好,无法给予用户寻
找相应信息的更多线索,用户看到这类页面往往最直接的反应并是关闭浏览器窗口离开,这在很大
程度上给网站造成损失。毕竟,对网站来说,用户永远是最重要的资源,以这种方式损失用户更意
味着某种程度的失败。
这也是许多网站使用自定义 404 错误页面的原因。通过良好的自定义404 页面,可以包含对网
站的相应介绍、用户可能感兴趣的内容链接或者网站内容导航链接、内容搜索功能等,能够有效地
帮助访问者找到其欲寻找的内容或相似的内容,提高用户在网站内浏览更多信息的机会。
正确定义 404 错误页面:
1. 对于已经存在的信息由于路径改变而导致访问不了时,应该在IIS 中定义404 错误指向一个动
态页面,在页面里面使用301 跳转到新的地址,此时服务器返回301 状态码。
2. 当访问一个错误的链接时,将调用404 页面,但由于在IIS 里面设置的不同将导致返回不同的
状态码:
1. 404 指向的是一个htm 文件,此时页面返回的404 状态码,这是正确的。
2. 404 指向的是一个URL,例如 /error.asp,如果不在页面里面进行设置,仅仅是返回提示
的HTML 代码,将导致页面返回200 状态码,此时的危害在于,当很多页面找不到时,
都返回和访问正常页面时返回一样的200 状态码,将使搜索引擎认为该链接存在,并以
错误页面的内容进行收录,当这样的链接很多时,将导致大量页面重复,使网站排名降
低。处理方法:在显示完提示内容后,增加语句: Response.Status=”404 Not Found” ,
这样就保证页面返回404 状态码。
3. 避免在调用 404 页面的时候返回302 状态码,容易被搜索引擎认为是重定向作弊。
4. 检测方法,使用 HttpWatch 查看返回代码。参见:
在这个例子中,我请求的是http://www.rkseo.com/1223.html ,新浪返回错误页面,然后5 秒
钟后,使用js跳转到首页。
网页相似度
网页相似度是比较网页是否相似,通常有以下两种计算方式:
1. 根据网页摘要来比较,如果多个网页摘要的 md5 值一样,证明这些网页有很高的相似性
2. 根据网页出现关键词,按照词频排序,可以取N 个词频高的,如果md5 值一样,证明这些网页
有很高的相似性。
网页相似度对SEO 的影响:
谷歌 对网页相似度限制在60%,如果超过这个标准将导致页面不被收录,或者收录后排名靠后中。
Robots.txt 带来的好处
1. 几乎所有的搜索引擎 爬虫 都遵循robots.txt 给出的爬行规则,协议规定搜索引擎爬虫 进
入某个网站的入口即是该网站的robots.txt,当然,前提是该网站存在此文件。对于没有配置
robots.txt 的网站,爬虫 将会被重定向至404 错误页面,相关研究表明,如果网站采用了自
定义的404 错误页面,那么爬虫 将会把其视作robots.txt——虽然其并非一个纯粹的文本文
件——这将给爬虫 索引网站带来很大的困扰,影响搜索引擎对网站页面的收录。
2. robots.txt 可以制止不必要的搜索引擎占用服务器的宝贵带宽,如email retrievers,这类搜索
引擎对大多数网站是没有意义的;再如image strippers,对于大多数非图形类网站来说其也
没有太大意义,但却耗用大量带宽。
3. robots.txt 可以制止搜索引擎对非公开页面的爬行与索引,如网站的后台程序、管理程序,事
实上,对于某些在运行中产生临时页面的网站来说,如果未配置robots.txt,搜索引擎甚至会
索引那些临时文件。
4. 对于内容丰富、存在很多页面的网站来说,配置 robots.txt 的意义更为重大,因为很多时候
其会遭遇到搜索引擎爬虫 给予网站的巨大压力:洪水般的爬虫 访问,如果不加控制,甚
至会影响网站的正常访问。
5. 同样地,如果网站内存在重复内容,使用robots.txt 限制部分页面不被搜索引擎索引和收录,
可以避免网站受到搜索引擎关于 duplicate content 的惩罚,保证网站的排名不受影响。
Robots.txt
搜索引擎通过一种程序robot(又称爬虫),自动访问互联网上的网页并获取网页信息。
您可以在您的网站中创建一个纯文本文件 robots.txt,在这个文件中声明该网站中不想被robot 访问的
部分,这样,该网站的部分或全部内容就可以不被搜索引擎收录了,或者指定搜索引擎只收录指定
的内容。robots.txt 文件应该放在网站根目录下。
robots.txt 文件的格式:
“robots.txt”文件包含一条或更多的记录,这些记录通过空行分开(以CR,CR/NL, or NL 作为结束符),
每一条记录的格式如下所示:
“<field>:<optionalspace><value><optionalspace>”。
在该文件中可以使用#进行注解,具体使用方法和UNIX 中的惯例一样。该文件中的记录通常以一行
或多行User-agent 开始,后面加上若干Disallow 行,详细情况如下:User-agent:
该项的值用于描述搜索引擎robot 的名字,在”robots.txt”文件中,如果有多条User-agent 记录说
明有多个robot 会受到该协议的限制,对该文件来说,至少要有一条User-agent 记录。如果该项的值
设为*,则该协议对任何机器人均有效,在”robots.txt”文件中,”User-agent:*”这样的记录只能有一条。
Disallow:
该项的值用于描述不希望被访问到的一个URL,这个URL 可以是一条完整的路径,也可以是
部分的,任何以Disallow 开头的URL 均不会被robot 访问到。例如”Disallow:/help”对/help.html 和
/help/index.html 都不允许搜索引擎访问,而”Disallow:/help/”则允许robot 访问/help.html,而不能访问
/help/index.html。任何一条Disallow 记录为空,说明该网站的所有部分都允许被访问,在”/robots.txt”
文件中,至少要有一条Disallow 记录。如果”/robots.txt”是一个空文件,则对于所有的搜索引擎robot,
该网站都是开放的。
不同位置的网页优化
网站首页优化:
1. 关键词选择
首页的关键词应该选择核心关键词。通常这些词优化难度比较大,需要大量的外部链接。交换
链接的时候以网站名称或者核心关键词命名链接。参见:域名及网站名称中的关键词
例如:在搜索引擎优化行业,首页的关键词应该是 SEO。
2. 网页链接
首页大部分都是链接,最新的链接要放在网页的前面,便于搜索引擎收录。
3. 更新频率
爬虫第一个来到的页面就是首页,首页一定要经常更新,爬虫就会来的比较频繁,链接的页面
将会更快被收录。
栏目页优化:
1. 关键词选择
栏目页的关键词,相对首页,可以选择次一些的关键词,以核心“SEO”为例,栏目也可以是“SEO
培训”,“SEO 教程”等。
2. 内部链接
栏目页一定要链接到首页,为首页建立内部链接。同时和其他栏目页也要相互链接。
栏目页大量的链接内容页,链接数量控制在 100 个以内。
内页优化:
1. 关键词
内页可以不特别关注关键词,可以将 Meta 标题 设置成相同的内容。在页面里更多的利用H1,
IMG、STRONG 标签优化关键词。
2. 内容
网页要以内容为主,大于5K 时,可以做翻页处理。内容最好是原创,内页收录的越多,从搜索
引擎来的流量才能越多。
3. 链接
通常内页很少有外部链接的,除非内容非常好,被人转载。内页要链接栏目页和首页,大量的
内页链接,有利于栏目页和首页的关键词排名。内页最好能链接内容相关的其他内页,这样可
以增加网页的相关度,同时方便用户浏览,增加网站的PV。
FLASH 优化
Flash 会使页面很好看,不过FLASH 网页有一个非常致命的问题,即大部分搜索引擎无法识别
FLASH 中的信息。
例如:一汽轿车
FLASH 优化可以从以下三个方面来考虑:
1、做一个辅助 HTML 版本:
保留原有 FLASH 版本的同时,还可以设计一个 HTML 格式的版本,这样既可以保持动态
美观效果,也可以让搜索引擎通过 HTML 版本的网页来发现网站。
2、将 Flash 内嵌 HTML 文件:
还可以通过改变网页结构进行弥补,即不要将整个网页都设计成 Flash 动画,而是将 Flash
内容嵌入到 HTML 文件中,这样对于用户浏览并不会削弱视觉效果,搜索引擎也可以从
HTML 代码中发现一些必要的信息,尤其是进入内容页面的链接。
图像优化
一般而言,搜索引擎只识读文本内容,对图片文件是视而不见的。同时,图像文件直接延缓页面加
载时间,如果超过 20 秒网站还不能加载,用户极有可能离开你的网站。因此, 除非你的网站内容
是图片为主,比如游戏站点或者图片至关重要,否则尽量避免使用大图片, 更不要采用纯图像制作网页(SPLASH PAGE)。
网站图片优化的有以下几点:
1. 在保持图像质量的情况下尽量压缩图像的文件大小。
2. Alt 属性:
每个图像<IMG>标签中都有 ALT 属性,搜索引擎会读取该属性以了解图像的信息。因此,最好
在所有插图的 ALT 属性中都有文字描述,并带上该页关键字在其中。
比较好的例子:
<img align=”center” src=”NP110.jpg” alt=”浪潮英信NP110 G2 服务器图片” >
3.在图片上方或下方加上包含关键词的描述文本;
4.使用链接链接到这个图片。
例如:谷歌 图片搜索 NP370 浪潮英信NP370 G2 排名第一。
谷歌的图像搜索(谷歌bot-Image)和谷歌的文本搜索(谷歌bot)不是同一个爬虫。
框架结构
框架结构,即帧结构(Frame),包括IFrame,Frame。
例如:框架结构示例。
<frameset rows=”97,*” cols=”*” frameborder=”yes” border=”0″ framespacing=”0″>
<frame src=”top.html” name=”topFrame” frameborder=”no” scrolling=”No” noresize=”noresize”
id=”topFrame” 标题=”topFrame” />
<frameset rows=”*” cols=”164,*” framespacing=”0″ frameborder=”no” border=”0″>
<frame src=”search_left/cat20.html?&catid=20&redirect=n” name=”left”
frameborder=”no” scrolling=”yes” id=”left” 标题=”leftFrame” />
<frame src=”CPU/cat20_list_1.html” name=”main” id=”main” scrolling=”yes”
标题=”main”>
</frameset>
</frameset>
<noframes>
在这里进行优化!
增加链接 <a href=” http://intozgc.com/CPU/cat20_list_1.html” 标题=” CPU报价”> CPU报价</a>
</noframes>
框架型网站的优越性体现在页面的整体一致性和更新方便上。尤其对于那些大型网站而言, 框架结
构的使用可以使网站的维护变得相对容易。但框架对搜索引擎来说是一个很大的问题,这是由于大
多数搜索引擎都无法识别框架,也没有什么兴趣去抓取框架中的内容。此外, 某些浏览器也不支持
框架页面。
如果网页已经使用了框架,或出于某种原因一定要使用框架结构,则必须在代码中使用 “Noframes”
标签进行优化,把 Noframe 标签看做是一个普通文本内容的主页。在 <Noframe></Noframe>区域
中包含指向 frame 页的链接以及带有关键词的描述文本,同时在框架以外的区域(标题,meta)也出现
关键词文本。这样,搜索引擎才能够正确索引到框架内的信息。
还有一个办法是采用 iframe 即内联框架(Inner Frame)技术来避免 Frame 带来的不便。所
谓 iframe 也是框架的一种形式,它是相当于在主浏览器窗口中内嵌一个子窗口,内容自动
打开。iframe 可以嵌在网页中的任意部分,也可以随意定义其大小,其代码显示为:
实例:<iframe src=xx width=x height=x scrolling=xx frameborder=x></iframe>
对搜索引擎来说,iframe 中的文字是可见的,也可以跟踪到其中链接指向的页面,不过与
用户所见不同的是,搜索引擎将 iframe 内容看成单独的一个页面内容,与被内嵌的页面无
关。
目录和文件命名
目录和文件名称中的关键词
目录名称和文件名称中可以使用到关键词。如果是关键词组,则需要用分隔符分开。我们常用连字
符“-”和下划线“_”进行分隔,URL 中还经常出现空格码“%20”。因此,如果以“中国制造”作
文件名,就可能出现以下三种分隔形式:
made-in-china.htm
made_in_china.htm
made%20in%20china.htm
连在一起之后,关键词就失去了意义。但事实上,至少在目前 谷歌 并不认同“_”为分隔符。对
谷歌 来说, made-in-china 和 made%20in%20china 都等于 made in china,但 made_in_china 就
被读成了 madeinchina,
因此,目录和文件名称如果有关键词组,要用连字符“-”而不是下划线“_”进行分隔。
URL 应该越短越好
有人为了单纯增加关键字而额外建多一个带有关键字的子目录,改变目录结构。由于 URL 中含有
关键字本身对排名提高帮助并不大,因而这种做法多此一举,也是搜索引擎反感的。
不好的例子:
要做英文关键词 computer,这样的目录 http://www.ibm.com/computer/computer/computer.html 是错
误的。
好的例子:
http://www.ibm.com/computer/ 该目录在根目录下的第一级,权重相对第二级较大。
关键词密度
在确定了自己的关键字之后,需要在网页文本中适当出现这些关键字。
控制关键词数量:
一页中的关键词最好只有一个,然后所有内容都围绕这个关键词展开 ,才能保证关键词密度合理。
如果确实有大量关键词需要优化, 可以分散写在其它页面并有针对性的优化。最典型的情况是拥有
不同的产品和服务的情况下,对每个产品进行单网页优化,而不是罗列在一个首页上。
比如:火车票,排名在前面的http://train.piao.com.cn/,这个页面,就只针对“火车票”:<标题>火车票查询-北京火车票-上海火车票-广州火车票-二手火车票-转让|求购火车票-中国票务在线
火车票网</标题>
而http://fly.piao.com.cn/ 这个页面,就只针对“机票”:
<标题>机票-北京飞机票-上海飞机票-广州飞机票-飞机票价格查询-中国票务在线</标题>
飞机票排名第二页。飞机票。
关键字密度 (Keyword Density):
就是在一个页面中,关键词的数量占所有该页面中总的词数量的百分比,该指标对搜索引擎的优化
起到重要作用。关键字密度一般在 3% 到5% 较为合适,超过这一标准就有过高或过低之嫌。
计算方法:
例如:珠穆朗玛峰 高度
公式:关键词数量/总词数量=关键词密度
“珠穆朗玛峰” 关键词密度是 50%
“高度” 关键词密度是 50%
以下按字数计算是错误的:
“珠穆朗玛峰” 关键词密度是 5/7 -> 71%
“高度” 关键词密度是 2/7 -> 29%
获得关键词密度:
1. 使用FireFox 工具可以查看关键词密度,不过不是很准确:
SeoQuake (FireFox) ,SearchStatus (FireFox)
2. 登录网站http://tools.hxstat.com/keyword-density.asp 拷贝网页内容,输入关键词。
主机转移
如果你想转移网站的主机服务,要在取消原来的服务提供商之前,先找好新的供应商。先在新的服
务商处开个帐号,确保所有的文件都正确无误地传到新服务器上。网站在新服务器上运行无碍后再
联系你的原供应商,告知对方将终止合作,但确保他们不会马上关你的网站。再联系你的域名注册
商(可能是原主机提供商),变更域名服务器(DNS)。域名服务器的功能就是把你的域名解析成计算
机能够识别的 IP 地址。把旧的域名服务器改成新的,这个过程到生效时间大概 24-48 小时之内,
少数情况下可能要 72 小时。这期间,如果一个搜索引擎刚好来抓你的网页,要么抓到旧的 IP 地
址上的网站,要么抓到新的域名解析生效后的网站,总之都不会出现网站打不开的空档。
国外主机
对做海外业务的公司建议选择国外主机,有下列好处:
1.国外的网络速度比国内的要快很多,将使你的网站能够更快的展现给用户,提高用户的体验
度。
2.谷歌 对国外的网站有比较高的权重。国外很多机构的网站pagerank 在7 以上,而国内流量很大
的新浪、百度pagerank 才7。
3.国内很多服务器(虚拟主机)供应商对垃圾邮件发送者管理不严,国内ip 地址又极度缺乏。因
为你的邮件和网站放置的空间上是多用户(虚拟主机)共享一个ip 地址。其它人滥发垃圾
邮件,造成国外反垃圾邮件组织和国外提供虚拟主机商对这一ip 地址屏蔽。影响了你正常
的E-Mail 通讯。而国外的服务器对此管理相对较严格,能够保证你正常的E-mail 通信。
4.国外对某些行业政策比较宽松。
访问结构
访问结构即通过几层能够访问到最终页面,谷歌 最好为三层,百度不限。
较好的例子:
以 www.seochat.org为例。
www.seochat.org首页为第一层,百度优化为第二层, 百度如何优化为第三层。
这样的结果便于搜索引擎索引。百度如何优化这个页面在 百度和谷歌 里面都有收录。
二级域名访问结构:
由于三层的目录,容纳的页面有限,需要多级目录。
这个时候使用前面我们讲过的 二级域名方式扩大级数。因为二级域名算独立网站,目录层次从当前
二级域名算起。
外部访问结构:
有的网页在本网站层数很多,但也被谷歌 收录,这是因为这些网页在被其他网站引用,而谷歌
从其他页面进入这个页面。可以使用 link 命令查询该页的反相链接。
主机对 SEO 的影响之虚拟专用服务器(VPS)
虚拟专用服务器是利用VPS(Virtual Private Server)技术,将一部服务器分割成多个虚拟专享服务
器的优质服务。每个VPS 都可分配独立公网IP 地址、独立操作系统Windows/Linux、独立超大空间、
独立内存、独立CPU 资源、独立执行程序和独立系统配置等。用户除了可以分配多个虚拟主机及无
限企业邮箱外,更拥有独立服务器功能,可自行安装程序,自主重启服务器。
VPS 在SEO 优点:
同托管服务器类似,同样灵活。
VPS 的缺点:
1. 虚拟内存受限制,当内存占用稍大,就会出现 http 1.1 和错误。
2. 需要客户对服务器系统安装配置等等都非常熟悉,否则容易引起软件故障。
主机对 SEO 的影响之服务器托管
服务器托管是指为了提高网站的访问速度,将您的服务器及相关设备托管到具有完善机房设施、高
品质网络环境、丰富带宽资源和运营经验以及可对用户的网络和设备进行实时监控的网络数据中心内,以此使系统达到安全、可靠、稳定、高效运行的目的。托管的服务器由客户自己进行维护,或
者由其它的授权人进行远程维护。
数据中心可以为客户的关键服务器提供机柜及带宽出租服务,使服务器可维持每星期七日、全日二
十四小时无休止服务。当您有意建设自己的Web、Email、Ftp 服务器,而您的网站的应用很复杂或
您网站的访问率很高时,您可以选择自已购买服务器,进行整机托管。
托管的服务器在 SEO 优化过程中将更灵活,体现在以下方面:
1. 可以自由选择网站静态化策略。
2. 可以查看 IIS 服务详细日志。
3. 有利于搜索引擎更快的抓取页面。
影响主机的其他因素:
比如做一些高风险的关键词,比如:六合彩,在国内是禁止的。但在香港是合法的, 如果在国内做
这样的关键词,很可能被封IP,这个时候就需要使用香港的服务器主机了。
但如果做的关键词是国家严格禁止的,比如法轮功等,无论网站在何地,都将被屏蔽。
主机对 SEO 的影响之虚拟主机
现在许多小型企业网站都采用虚拟主机的方式。虚拟主机是使用特殊的软件技术,把一台网站服务
器划分为若干个“虚拟”的主机。每个虚拟主机都可以是一个独立的网站,可以具有独立的域名,
具有完整的Internet 服务器功能(WWW、FTP、Email 等),同一台主机上的虚拟主机之间是完全独
立的。从网站访问者来看,每一台虚拟主机和一台独立的主机(采用服务器托管、专线上网等方式
建立的服务器)完全一样。
用虚拟主机建设网站具有下列特点:
(1)相对于购买独立服务器,网站建设的费用大大降低,为普及中小型网站提供了极大便
利;
(2)网站服务器服务器管理简单,诸如软件配置、防病毒、防攻击等安全措施都由专业服
务商提供,大大简化了服务器管理的复杂性;
(3)网站建设效率提高,自己购买服务器到安装操作系统和应用软件需要较长的时间,而
租用虚拟主机通常只需要几分钟的时间就可以开通,因为现在主要的服务商都已经实
现了整个业务流程的电子商务化,选择适合自己需要的虚拟主机,在线付款之后马上
就可以开通了。
以上是虚拟主机的优点,当然虚拟主机也有一定的适用范围,有些方面也存在缺点,比如:
(1)某些功能受到服务商的限制,比如可能耗用系统资源的论坛程序、流量统计功能等;
在网站静态化时,通常不能使用 IIS_Rewrite 动态库,只能使用404 错误转发处理,使
工作量增加。
(2)网站设计需要考虑服务商提供的功能支持,比如数据库类型、操作系统等;
(3)某些虚拟主机网站访问速度过慢,这可能是由于主机提供商将一台主机出租给数量众多
的网站,或者服务器配置等方面的原因所造成的,这种状况网站自己无法解决,对于网
站的正常访问会产生不利影响;另外如果该主机上有被搜索引擎惩罚的网站,将对你网
站的排名带来潜在风险。
可通过下列工具查看该 IP 下有多少个网站:
登录 http://www.域名tools.com/reverse-ip/ 查询,显示域名总数及部分域名。全部显示
需要花钱购买。
例如:125.208.6.133
显示:
There are 14 域名s hosted on this IP address.
Here are a few of them:
Baidufocus.com
Dainisou.com
Eduoceansoft.com
Seo007.com
SuperCSS.com
注意:此方法仅能查询国际域名,对国内域名无效。
(4)有些服务商对网站流量有一定限制,这样当网站访问量较大时将无法正常访问。
二级域名
二级域名形式如:yourname.site.com,而不是 www.yourname.com。拥有自己的独立域名是网站对搜
索引擎友好的基础。目前有很多网站提供免费空间,如博客(Blog)免费空间, 企业免费空间, 免
费自助建站,电子商务平台等,通常为用户分配一个二级域名,或页面存放于网站的某一路径下。
使用别人主域名的二级域名的弊端:
解 释 : 主 域 名是别人的, 而二级域名是你自己的。例如:www.superCSS.com 是 某 某的,
langchao.supercss.com是自己的。
1.如果你所使用二级域名的主域名受到惩罚,那么你的网站也会受到牵连;
我以前有个网站,做浪潮服务器的,域名langchao.supercss.com 在百度上排名很好,后来
因为www.supercss.com 被百度屏蔽,导致我的浪潮服务器网站也被清除。2.网站流量排名的时候,你所有的流量都会归功于所依托的顶级域名。
alexa 排名默认就是顶级域名。
如何规避这些风险呢?
最好为自己的二级域名网站注册一个独立域名,然后做域名转发,对顾客访问和网站管理很有
用。即使有一天你的二级域名的主站停止营业了,你还可以再做一个相同的网站,因为你的独
立域名没有变,老用户仍然可以找到你。
例如:test.supercss.cn,隐藏目的地址: test1.supercss.cn。通常域名转发是上述方法。
使用别人主域名的二级域名的优势:
1.可以借助主域名的资源,使排名快速提升。
A.举例:汽车,排名在前几位的都是大网站的汽车频道。
B.还要一阵大部分人使用 博客进行排名,主要也是利用主站的资源。例如:我的“浪潮
服务器报价”, 在百度里面搜索, 有两个supercss.yourblog.org ,
www.mmmcetseo.com/blog_supercss/ 都排在第一页。
2.和搜索引擎是一家人,更容易获得认可。
A.百度空间是百度的一个产品,在百度空间里面发布内容,很容易就可以获得排名。
例如:垂直打击下载结果记录中就有百度空间。
B.谷歌 Blogger 是谷歌 的博客系统。通常如果你使用自己网站申请谷歌 Adsense 的
时候,可能会被拒绝。但如果你使用 Blogger 来申请的话,就很容易通过了。
使用自己的主域名,发展二级域名的优势:
1.网站流量排名的时候,所有的流量都会归功于所依托的顶级域名。
例如:9rkseo.com 是一个免费域名系统。查看它的alexa流量,它自己的流量仅仅占23%,其
他都是二级域名的流量。美姬园。
2.搜索引擎收录时,二级域名算独立的网站,可以扩大收录页面的数量。
例如:site:alibabetseo.com 时,收录数量达到12,100,000 项;
site:china.alibabetseo.com 时,有 3,070,000 项;
site:blog.china.alibabetseo.com 时,有 414,000 项;
site:wzz331190.blog.china.alibabetseo.com时,只有1 项。
这就是说,只要不作弊,一个二级或三级域名至少能够收录一页,发展上万个二级域名,使收
录的数量大量增加。
域名注册
域名注册后,此域名才能真正的属于你!
域名注册步骤:
1. 查询此域名是否可以注册?
中国万网 http://www.net.cn/
2. 在搜索引擎里查询此域名是否使用过?
方法:以 www.ttscj.com 为例
百度搜索 域名:www.ttscj.com
http://www.baidu.com/s?wd=域名%3Awww.ttscj.com&cl=3
谷歌搜索www.ttscj.com
http://www.谷歌.com/search?hl=zh-CN&newwindow=1&q=www.ttscj.com&lr=
3. 查询此域名是否有历史记录?
http://web.archive.org/collections/web.html
4. 全部符合条件,请立即注册!!!!
从查询到注册,时间不要间隔太长,因为好的域名越来越少了,注册的人也越来越多,如果耽
搁几分钟,这个域名就有可能就被别人注册了。
过期域名
也许你曾经有这样的困惑,刚刚申请的域名,做好的网站,可搜索引擎就是不收录,这是什么原因
呢?这是因为这个域名以前被人使用过,由于作弊被搜索引擎删除,所以放弃续费导致域名过期,
结果被你重新注册。
域名过期是指域名到期后仍未续费,注册机构将域名暂停、DNS 也停止解析、网站无法无法访问的
状况。具体情况如下:
1.国际域名到期后仍未办理续费,域名暂停、DNS 停止解析、网站无法访问,对其进行续费后,
经过1-2 个工作日,可恢复解析。
2.国内域名到期后仍未办理续费,cnnic 会将您的域名暂停、DNS 停止解析,网站无法访问,对
其进行续费后,经过2-3 个工作日,可恢复解析。
3.域名失效:国际域名到期后,30 天内未办理续费,域名将失效。国内域名到期后,15 天内未
办理续费,域名将失效。
利用过期域名进行优化:
过期域名并不都是因为作弊而放弃续费的,里面有很多因为网站的工作人员疏忽或者网站倒闭导致域名没有及时续费。重新找回丢失的域名将会花费很大成本和精力。所以要及时为自己的域名续费。
实例:
www.jeep.cn 原属北京吉普汽车有限公司 ,后因过期被深圳市百酷科技有限公司抢注。
www.FM365.com 属联想集团,后被265.com 站长顿觉抢注成功。
某些过期域名具有很高价值:
比如:某网站由于经营不善导致关门,域名自然没有人续费面临过期,而在网站推广的过程中
建立的大量的外部链接,在搜索引擎中收录的页面很多,pagerank 值很高,此域名具有很大的价值,
如果此域名业务和你的业务相同,那你在搜索引擎推广方面已经事半功倍了。
如果不小心注册了被搜索引擎屏蔽的域名请参见:搜索引擎对作弊的处罚中重新申请加入的内容。
过期域名查询工具:易名中国 http://www.ename.cn/DoMainFind.jsp
域名后缀
域名后缀有很多,通常是.com,.com.cn,.cn,.org,.net 等。
有一种观点认为:在同等情况下,代表非商业性网站的后缀.org 和.net 有着比.com 更高的排名优
势;对中文网站来说,表示中国域的.cn 和.com.cn 又比无地区性的.com 有一定优势。
从用户角度来看:用户记住一个域名,通常是主域名,后缀默认的认为是.com,所以不论注册了多
少个后缀,一点切记要把.com 后缀注册上,避免流量丢失。
反面的例子:胜龙科技www.shenglong.com.cn 是做证券分析业务的网站。而后缀为.com的域名
www.shenglong.com没有注册而被别人抢注,不仅对公司形象有一定的影响,如果被竞
争对手获得,那将严重影响你的业务。
域名及网站名称中的关键词
域名中的关键词虽然为网站排名加分影响不是很大,但有条件的最好在域名中能够出现关键词。如
果是英文,多个关键词之间要使用短横线“-”来分隔,不要使用下划线“_”。短横线隔开后的关键
词组还可以获得更多的词组搜索结果,如www.madeinchinetseo.com 被认为只有一个词 madeinchina,
而 made-in-china 则被看作正常的made in China 词组。
网站名称中出现关键词对排名影响很大,而且关键词出现的越靠前,作用越大。通常首页的标题就
是网站的名称,在进行友情链接时就相当于为你的核心关键词作了外部链接。
比较好的例子:手机之家www.imobile.com.cn ,网站核心关键词:手机。
Seo协会www.seo.org.cn ,网站域名及名称最前面都是核心关键词SEO。
域名对 SEO 的影响
域名是网站的基础,一个好的域名对于网站的意义是不言而喻的。
域名及网站名称
域名,是人们进入互联网时对其相应网站的第一印象。如果别人看到您的域名就会联想到这是一个
什么样的网站、突出的主题、所在的行业和地区;第一步便是成功的。如果该域名更具有简洁、明
了、好记、含义深刻的特点,可以肯定这必是一个好的域名。
好的域名及网站标准:
1.通过域名就可以想起网站名称,记得网站名称就可以输入域名。
比较好的例子:百度www.baidu.com , 域名就是中文名称的拼音,非常容易记忆,而且输入也
非常方便。
比较差的例子:帖易www.teein.com , 域名是英文的组合,我知道这个网站有一年多了,每次
都输错,不得不在百度里面查询。
2.字符不要太长,最好在6 个以内,这样比较容易记忆。
3.域名中的字符最好少出现远离键盘中心的字母,比如:z、x 等。这样用户输入起来比较方便。
比较好的例子:谷歌 www.谷歌.com ,输入快速。
比较差的例子:中搜www.zhongsou.com ,输入起来比较费劲。
4.域名中的字符最好少出现多音节的字母,比如:w、x 等。当你向别人介绍你的域名的时候,读起
来会很拗口。
域名查询:中国万网 http://www.net.cn/
成为 SEOER 应该具有的素质
SEO 是网络营销的重要方法,我们将学到SEO 所需要的各种技术,这些技术都是经过实践考研的。
不要因为一时优化没有上去而放弃,要对SEO 技术和自己的能力有信心。
2 耐心
做 SEO 是一个长期的繁杂的过程,周期可能是几个月,所以一定要有耐心,并坚持做下去。
举个例子:我曾经做了一个垃圾站,提交给百度很久了,就是不见收录,我有点灰心了,就不再
关心这个网站了。过了几个月,偶然想起这个网站,再看看,收录的非常好。
3 细心
SEO 涉及到网站内外的方方面面,因素很多,在遇到问题的时候,要仔细根据现象将全部的可能
都要想到,针对每个进行深入分析,这样才能解决问题。
举个例子:我做的另外一个网站,百度收录了一段时间后就不再收录了,我找了很多地方都没有
发现问题,某日在查看网站代码的时候发现,因为一个标记设置的特别小,导致新的数据显示不出
来,将这个值改大后,收录又正常了。
4 虚心
SEO是一个变化很快的技术,你刚刚学到的可能几个月以后就失效了;同时还可能有更多更好的
技术出现,所以要经常向同行学习
正确认识搜索引擎优化
搜索引擎优化(SEO)是网站采用对搜索引擎友好的技术手段,达到网站在搜索引擎中排名靠前及收录
数量增加。搜索引擎优化工作贯穿网站策划、建设、维护全过程的每个细节,值得网站设计、开发
和推广的每个参与人员了解其职责对于 SEO 效果的意义。
优化好的网站,从搜索引擎来的流量将会有很大的提高,不过这仅仅是能带来用户,而真正能够留
住用户的是网站的内容。所以搜索引擎优化仅仅辅助手段,在网站建设的过程中仍然要将大部分精
力放着网站内容的完善上。
由于优化目的是在搜索引擎上获的好的排名,而搜索引擎不属于我们,排名的影响因素有很多,所
以对优化的效果就不可能有100%的把握,我们能做的是就是在已知的因素上下功夫,做到齐头并进,
这样不论搜索引擎算法如何改变,都不会使排名有特别大的波动。
Google PageRank
概述:
pagerank 值,即网页级别
谷歌 对网页级别的描述:“作为组织管理工具,网页级别利用了互联网独特的民主特性及其巨大
的链接结构。实质上, 当从网页 A 链接到网页 B 时,谷歌 就认为“网页 A 投了网页 B 一票”。
谷歌 根据网页的得票数评定其重要性。然而,除了考虑网页得票数(即链接)的纯数量之外,
谷歌 还要分析投票的网页。“重要”的网页所投出的票就会有更高的权重,并且有助于提高其它
网页的“重要性”。
pagerank 值算法原理:
一个网页被多次引用,则它可能是很重要的;
一个网页虽然没有被多次引用,但是被重要的网页引用,则它也可能是很重要的;
一个网页的重要性被平均的传递到它所引用的网页。这种重要的网页称为权威网页。
参见:怎样查自己网站的反向链接?
影响 pagerank 值的因素:
1. 网站的导入链接质量。导入链接越多质量越高,该页面的pagerank 值就越高。
2. 导出链接数量。导出的越少,导出的链接获得的pagerank 值就越高。
反例:http://www.soft6.com/inc/link.shtml 导出链接过多。
3. 搜索引擎收录一个网站的页面数量。数量越多,内部链接就越多。
4. 首页pagerank的高低。
首页是推广的核心页面,所以网站首页pagerank 高低对内页各pagerank 也产生直接影响。
首页﹥一级页面﹥二级页面﹥三级页面……每深入一级,pagerank 降低1 -2 个档次。
5. pagerank 值的更新:
谷歌 每个月进行一次彻底的数据更新,更新后的网站排名和导入链接都会有某些变化,但其 pagerank
更新时间一般要延迟至数据更新后三个月左右,而且网站的 pagerank 值相对稳定, 要上升或下降一级
pagerank 是很不容易的事情。
pagerank 值的作用:
1.网页比较重要,拥有了排名靠前的优先权。
2.具有了获得高质量导入链接的谈判优势。
3.搜索引擎会加快对网页数据的更新。
搜索引擎对作弊的处罚
搜索引擎的惩罚会根据所犯的错误而定,具体显示现象:
1. 关键词排名降低。
2. 长时间不更新网页内容。
3. 收录减少,甚至为 0。
4. 网站 pagerank 值成0。
发现网站被屏蔽后,应查找网站被屏蔽的原因,修改后,向搜索引擎提交申请,请求再次收录:
1. 谷歌
要申请重新加入,请登录谷歌 Sitemap,选择”申请重新加入”链接,然后按照所示步骤操作。
权威指南:http://www.谷歌.com/support/webmasters/bin/answer.py?answer=3etseo43
2. 百度
首先请确认您的网站上已经没有作弊行为,然后请到百度登录吧或发送邮件到spam@baidu.com,
按照下面的内容进行说明,一般在一个月后可以被解除。
您应在申请解除惩罚的邮件中说明以下内容:
请说明您的网站地址
请说明您什么时间发现网站在百度消失的?
请说明您确认使用了何种被百度确认的作弊方法?
好的例子:
百度申请撤销信样例:
尊敬的百度客服:
您好!
首先我自我介绍一下,我是时尚Q 族www.lm5etseo8.com 的站长,我叫自由幻想,我的网站建
立于06 年的10 月份,最近因为种种原因我把网站上的程序换了一下以后,百度的收录就成0
页,我不知道为什么会这样的,我一直按照百度搜索引擎的里面协议规定的去做的,没有作弊
也没有违反你们的规定,麻烦尊敬客服帮我重新收录一下,非常感谢你们辛勤的工作,最后我
祝百度越办越好!!
自由幻想
这位网页在信发出 1 周后,域名被恢复,现在收录达1180 页。
3. 对于无法恢复的域名,最好的办法就是重新注册新的域名。
搜索引擎优化是万能的么?
搜索引擎优化不是万能的,网站内容建设才是最重要的:1.搜索引擎优化可以帮助网站收录更多的内容,这个很简单。
2.搜索引擎优化可以使网页排名更高,这个也不太难。
3.搜索引擎优化不能保证让用户看到结果后一定会点击,这个需要网站编辑从用户需求出发设计能
够吸引人的标题和简介。
4.搜索引擎优化不能将流量转换为订单,这个很难。通常涉及到网站可用性、网站可信度、产品价
格、销售人员的素质等等方面,需要综合考虑。
什么是Sitelinks
1、什么是Sitelinks
经常使用谷歌的人,一定对下面这情况并不陌生:可能搜索某一关键词的时候,会发现排在第一名的结果除了正常的显示标题、描述和网址之外,下面还可能会以链接的方式列出几个该网站其他页面的标题。这种情况下,第1名在谷歌显示的位置范围差不多是第2名的二倍,更加吸引注意和彰显行业至尊地位。
这种情况在谷歌以前出现了很久,但似乎最近才从谷歌的网站管理员帮助中心得到了比较详细的解释:
The links shown below some sites in our search results, called Sitelinks, are meant to help users navigate your site. Our systems analyze the link structure of your site to find shortcuts that will save users time and allow them to quickly find the information they’re looking for.
We only show Sitelinks for results when we think they’ll be useful to the user. If the structure of your site doesn’t allow our algorithms to find good Sitelinks, or we don’t think that the Sitelinks for your site are relevant for the user’s query, we won’t show them.
At the moment, Sitelinks are completely automated. We’re always working to impagerankove our itelinks algorithm, and we may incorporate webmaster input in the future.
显示在有些网站的搜索结果下面的链接,叫做站内链接(Sitelinks),这些链接是为了帮助用户更好地访问你的站点。我们的系统通过分析网站的链接结构,来发现这种快捷方式,以帮助用户接省时间、更迅速地找到他们想找的东西的。
只有当我们觉得这些站内链接对我们的用户非常有价值的时候我们才会把他显示出来。如果你网站的结构不能让我们的算法找出高质量的站内链接,或者我们认为这些链接跟我们的用户搜索请求并不相关的时候,我们也不会把它们显示出来。
目前,站内链接完全是机器自动生成的,我们也一直在致力于提高我们的站内链接算法,将来我们可能会让我们的广大网站管理员参与进来。
根据谷歌的说法,Sitelinks的主要目的在于帮助用户更快速、以更简单的方式找到所需的信息。当然,谷歌只是对部分关键词排在首位的网站才提供Sitelinks,一般说来,这类关键词多为网站名称、品牌、商标。
2、如何获得谷歌 Sitelinks?
既然谷歌 Sitelinks是通过算法自动得出的,那么肯定有些较重要的因素能够帮助网站获得Sitelinks,也许,这是下一步网站建设者努力的一个方向,毕竟,与单纯的所谓排名优化相比,让更多的用户点击访问网站才是实现SEO目标的真正保障。
首先要在特定的搜索项中排名第一,这是最根本的,因为Sitelinks只向在SERP中排名第一的网站提供。
使用网站名称或名称中的一部分作为主关键词,将是获得Sitelinks的决定性因素。
仔细撰写网页的描述与内容部分,对被DMOZ收录的网站,应考虑是否使用NOODP标签。据大多数人观察,谷歌 Sitelinks与网页在SERP中的点击量有关,也即是说,单纯排名是不够的,必须能在SERP页中引起用户的注意并点击。
网站的内部链接也相当重要,并要保证谷歌bot对网站深层页面的访问。此外,通过对大多数Sitelink页面的观察,内部链接与导航出现在网页HTML代码靠前位置具有一定优势。
很多人推测谷歌 Sitelinks可能使用谷歌 toolbar (工具条)数据来采集数据,包括用户对特定网页的访问情况、收藏情况等等,这就又回到了SEO的老问题上,即让用户感到有用,感到有价值而收藏并多次访问。
3、Sitelinks的其他推测
当然,在现阶段,仍然没有太肯定的关于Sitelinks实现机制的结论,但一般说来,如果某个网站在谷歌的SERP中拥有Sitelinks,可以认为谷歌将该网站判定为该搜索项方面的权威网站。
此外,在Sitelinks中,链接采用的方式使得玩味:SERP中的其他链接均是直接指向目标地址,而4个Sitelinks则采取类似JavaScript实现的302跳转,联系到谷歌说明中的“and we may incorporate webmaster input in the future”,说明了什么?
中国SEO市场概况
、
中国SEO市场开始萌芽于2003年初,2004年底,达到了一个高潮。但那时候SEO引起关注,更多是因为大量作弊手段的流行,严重影响了搜索引擎的正常使用。
这一期间所谓的SEO服务公司,大都是以兜售谷歌左侧排名为生。由于排名的不稳定性,导致在2005年5月份后,一大批所谓的排名公司倒闭。这一期间,标准的遵循搜索引擎搜索道德的SEO服务开始诞生。
2006年,是中国SEO迅速发展的一年,行业了出现了一批引导正确操作规范的个人,开始向中国的企业传播合理的SEO理念。SEO也得到了广大媒体的正面报道。而且像“好耶”这种大品牌SEO培训网公司的介入,SEO的形象得到极大的改善,也得到了谷歌,Yahoo、百度的承认。这一年内,大量的行业领军站点开始尝试SEO的魅力,这个行业也得到了前所未有的关注。中国的SEO服务,也有了信心向它在国外一样,成为网站开展SEO培训网的核心战略之一。
经过几年的积累和沉淀,国内目前SEO服务公司的基本现状为:
搜索引擎如何看待网站数据采集行为?
从05年开始,大量的站点采用采集系统来架构,这些站点所产生的页面大量充斥着搜索引擎的搜索结果,很多采集站点截取了原本属于原始网页的搜索流量,这极大地影响了搜索引擎排名的公平公正性,同时也大大降低了互联网用户的搜索体验,所以网页数据采集行为并不受搜索引擎的欢迎。
谷歌官方博客曾发表一篇名为“Site content and use of web catalogues”的文章,在该文章中有这么一句话:
谷歌 is willing to take action against 域名s that try to rank more highly by just showing scraped or other autogenerated pages that don’t add any value to users.
从上文看来,谷歌不再对采集行为坐视不管了。
与此同时,百度和雅虎中文搜索引擎也在其给网站管理员的帮助说明中指出,它们不会对采集系统产生的页面进行收录。到目前为止,我们依然可以在各大搜索引擎的搜索结果中看到很多采集系统输入的页面,至少网站所有者应该明白采集行为会增加网站在搜索引擎中的风险。如果搜索引擎察觉你的站点有采集行为,就很可能会对你的收录页面数据进行删除。
两大搜索引擎搜索语法
每个搜索引擎都有自己的高级搜索语法,通过高级搜索语法你可以方便快捷的查找你想要搜索的内容。
目录
一、 谷歌谷歌搜索高级语法
1. 减除无关资料 (-)
2. 英文短语搜索 (””)
3. 指定网域
4. 查找特定文件
5. 按链接搜索
6. 限定关键词只在标题中
7. 限定关键词只在URL中
8. Info
9. Related
10. Cache
二、 百度(baidu)搜索高级语法
1. 把搜索范围限定在网页标题中——in标题
2. 把搜索范围限定在特定站点中——site
3. 把搜索范围限定在url链接中——inurl
4. 精确匹配——双引号和书名号
5. 要求搜索结果中不含特定查询词
6. 专业文档搜索
告别平淡 妙用搜索
现在的搜索引擎如雨后春笋般涌现,谷歌、百度、搜搜等等。每个搜索各有优势,我们也各有喜好。如何是
好呢?用深搜熟滤解决取舍问题!
深搜熟滤(h t t p: //w w w. n ew h u a .
c o m /s o f t /5 9 13 5 . h t m)是一款绿色软
件,支持多个搜索引擎进行同时搜
索,并能够自动提取信息。
☆以搜索引擎为线索
打开软件后,在空白栏处填入你
要搜索的内容,点击“搜索”按钮后,
下方会出现多个搜索结果。搜索关键
词“奥运”,每个搜索引擎都会搜索出
结果来。点击“设置”选项卡,可以进行详
细的设置。在第一行,可以勾选需要的搜索引擎,不需要的去
掉勾选即可。
☆以内容类型为线索
点击每个选项卡,会发现“深搜
熟滤”针对不同的类型,提供了相对
应的网站,比如“ 视频”下提供了优
酷、5 6、土豆等常用视频网站。在“商
贸”下提供了阿里巴巴、淘宝、拍拍、
易趣等
自定主搜索引擎

我们习惯在桌面建立搜索引擎的快捷方式,但在V ista下这招
可以省了。打开“Internet属性”,点击“搜索”下的“设置”按钮,在
“更改搜索默认值”中点击“查找更多提供程序”,在打开的网页中
选择喜欢的搜索引擎,然后点击“添加提供程序”并退出。回到“更
改搜索默认值”中选中刚才添加的程序,再点击“设置默认值”。以
后点击桌面“开始”按钮,在搜索框内键入关键字后再点击“搜索
Internet”,系统即会采用你设置的搜索程序搜索了。
另类搜索引擎
我们最常用的搜索引擎无非是谷 
歌、百度,这是主流的。今天来
看看有哪些非主流的另类搜索引擎
吧,用它们来找报告、找人脉、找美
女,呵呵,反正用G o o g l e、谷歌搜索不
到的它们都能搜到。如下例:
白领一族常常会被做企划、写报
告弄得焦头烂额,没有资料,不懂格
式。如果能找一些现成的报告作为
参考是不是就简单多了。进入h t t p : //
w w w. s o w a n g . c o m /f i l e . h t m,在该页
面中,我们发现可以同时利用“ 百度
文档搜索”、“Q Q文档搜索”、“雅虎
文档搜索”三个搜索引擎来同时搜索
Wo r d、P o w e r p o i n t、E x c e l等格式的
调查报告、工作计划、总结、商业计算
书、毕业论文等多达3 0 多种内容的专
业文档。其他同类搜索引擎推荐:
(1)ht t p: // w w w.s i d e k i q.c om /
(2)ht t p: // i b o o g i e.c om /
(3)ht t p: // w w w.pag e bul l.c om /
2 1世纪最缺的是什么?是人脉!
美国社会心理学家米尔格伦提出的
“六度分隔理论”,如今已成各大“社
会网络系统”(S N S)的信条,成功推
出“人脉搜索引擎”。通过人脉搜索
引擎,能够寻找到自己的商业合作伙
伴,面对面与自己的人脉圈中的朋友谈生意。同样适用于寻觅专业人才的
人事经理,以及发了成堆简历却一无
所获的求职者。相关搜索引擎推荐:
(1)ht t p: // w w w.k i n g s n s.c om /
(2)ht t p: // w w w.l i nk i st .c om
(3)ht t p: // w w w.weal i nk .c om /
校园网资源哪里找
以寻找经济学P P T课件为例,我讲下方法。打开一个搜
索网站(推荐www.baidu.com 和 www.谷歌.com )然后
填上“f ilet y pE:ppt 政治经济学”,然后搜索引擎就会帮我找
到网络所有的以PPT结尾的经济学课件。一般来说,baidu和
谷歌支持搜索的文件格式有doc、ppt、els等。如果你觉得
这样很麻烦,那你也可以直接去ht tp://f ile.baidu.com/ 搜
索。另一个可以直接去ht tp://edu.baidu.com/ 所有国内教
育网的信息,在G O O G L E搜索则可以使用“s i t E:e d u.c n ”
加上你的关键词。
iPhone火了,Gphone会怎样?

苹果的iPhone可以说是2007年让人最
怦然心动的硬件,苹果公司不愧为全球最
具创新性的公司。作为搜索引擎领域的老
大,谷歌也将在2008年进军手机领域。
谷歌的Gphone计划不仅仅是要开发出一款
手机,更多的是为了开拓手机服务市场。可
以想见,如果谷歌能够效仿苹果,推出几款
自有品牌的智能手机的话,凭借其强大的
品牌号召力,一定会是2008年手机领域最
值得期待的产品。不过,直到现在,苹果的
iPhone由于种种原因,仍然被拒之国门以
外。2008年,iPhone会登陆中国市场吗?
Gphone能够复制iPhone的神话吗?让我们
拭目以待。
网易今推全新论坛服务“有道快贴”

国内搜索引擎厂商的竞争
又掀波澜。网易旗下慧努搜索近日推出了全新
的论坛服务——“慧努快贴”测试版
(h t t p : / /tie.youdao.com)。
“慧努快贴”不但具备丰富的
表情系统,在回帖中可便捷插入图片和视频文
件,还提供了一步追帖、引用砌墙、个性化导
航等功能。而作为论坛服务底层引擎的慧努搜
索也发挥出看家本领,用户可以在任意版块中
输入关键词,并按主题、帖子内容甚至作者获
得查询结果
Groupization(群体搜索)

如今,搜索技术遭遇的最大挑战,是如何根据每个用户的细微差别,为他们提供
最妥帖的搜索内容。而微软的新技术—“群体搜索”(Groupization),将为搜索
引擎使用方式注入全新的内涵。在网络世界中,有着相同“兴趣”和“情趣”的人
在使用搜索时,使用的关键词和表达方式往往具有惊人的相似度。而微软的新技
术,能判断出这些人的志趣点,为他们找到符合他们思维和表达方式的搜索结
果。比如,人们在网络上谈论远程办公时,一些倾向于SOHO的人会联想到在家里
办公的好处,而另一些人则会把远程办公和在办公室上班作一个比较。如果使用
传统的搜索引擎,这两种人在搜索同一主题时,很可能得到相同的搜索结果。微
软要做的就是先通过交互手段搞清楚他们的倾向和原则,再把这些人划分成若
干的群体,为他们提供最精准与善解人意的搜索结果。



