搜索引擎基本工作原理

了解搜索引擎的工作原理对我们日常搜索应用和网站提交推广都会有很大帮助。

■ 全文搜索引擎

在搜 索引擎分类部分我们提到过全文搜索引擎从网站提取信息建立网页数据库的概念。搜索引擎的自动信息搜集功能分两种。一种是定期搜索,即每隔一段时间(比如 Google一般是28天),搜索引擎主动派出“蜘蛛”程序,对一定IP地址范围内的互联网站进行检索,一旦发现新的网站,它会自动提取网站的信息和网址 加入自己的数据库。

另一种是提交网站搜索,即网站拥有者主动向搜索引擎提交网址,它在一定时间内(2天到数月不等)定向向你的网站派 出“蜘蛛”程序,扫描你的网站并将有关信息存入数据库,以备用户查询。由于近年来搜索引擎索引规则发生了很大变化,主动提交网址并不保证你的网站能进入搜 索引擎数据库,因此目前最好的办法是多获得一些外部链接,让搜索引擎有更多机会找到你并自动将你的网站收录。

当用户以关键词查找信息 时,搜索引擎会在数据库中进行搜寻,如果找到与用户要求内容相符的网站,便采用特殊的算法——通常根据网页中关键词的匹配程度,出现的位置/频次,链接质 量等——计算出各网页的相关度及排名等级,然后根据关联度高低,按顺序将这些网页链接返回给用户。

…………………………………………………………………………….

■ 目录索引
与全文搜索引擎相比,目录索引有许多不同之处。

首先,搜索引擎属于自动网站检索,而目录索引则完全依赖手工操作。用户提交网站后,目录编辑人员会亲自浏览你的网站,然后根据一套自定的评判标准甚至编辑人员的主观印象,决定是否接纳你的网站。

其次,搜索引擎收录网站时,只要网站本身没有违反有关的规则,一般都能登录成功。而目录索引对网站的要求则高得多,有时即使登录多次也不一定成功。尤其 象Yahoo!这样的超级索引,登录更是困难。此外,在登录搜索引擎时,我们一般不用考虑网站的分类问题,而登录目录索引时则必须将网站放在一个最合适的 目录(Directory)。

最后,搜索引擎中各网站的有关信息都是从用户网页中自动提取的,所以用户的角度看,我们拥有更多的自主 权;而目录索引则要求必须手工另外填写网站信息,而且还有各种各样的限制。更有甚者,如果工作人员认为你提交网站的目录、网站信息不合适,他可以随时对其 进行调整,当然事先是不会和你商量的。

目录索引,顾名思义就是将网站分门别类地存放在相应的目录中,因此用户在查询信息时,可选 择关键词搜索,也可按分类目录逐层查找。如以关键词搜索,返回的结果跟搜索引擎一样,也是根据信息关联程度排列网站,只不过其中人为因素要多一些。如果按 分层目录查找,某一目录中网站的排名则是由标题字母的先后顺序决定(也有例外)。

目前,搜索引擎与目录索引有相互融合渗透的趋势。原 来一些纯粹的全文搜索引擎现在也提供目录搜索,如Google就借用Open Directory目录提供分类查询。而象 Yahoo! 这些老牌目录索引则通过与Google等搜索引擎合作扩大搜索范围(注)。在默认搜索模式下,一些目录类搜索引擎首先返回的是自己目录中匹配的网站,如国 内搜狐、新浪、网易等;而另外一些则默认的是网页搜索,如Yahoo。

什么是RSS

RSS是站点用来和其他站点之间共享内容的一种简易方式(也叫聚合内容)

在门户网站大行其道,人们已经习惯通过搜索引擎来获取新闻资讯的今天,一种全新的资讯传播方式已经悄悄地来到我们身边,仔细观察一些网站,你可能注意到一些被标记为”XML”或”RSS”的橙色图标。

面 对扑面而来的新闻,不用再花费大量的时间冲浪和从新闻网站下载,只要通过下载或购买一种小程序,这种技术被称为简易信息聚合(RSS:Really Simple Syndication)。RSS会收集和组织定制的新闻,按照你希望的格式、地点、时间和方式,直接传送到你的计算机上。新闻网站和那些在线日记作者已 体会到了RSS提要带来的乐趣,这也使读者可以更容易跟踪RSS提要

RSS是一个缩写的英文术语,在英文中被认为有几 个不同的源头,并被不同的技术团体做不同的解释。它既可以是”Rich Site Summary”(丰富站点摘要),或”RDF Site Summary”(RDF站点摘要),也可以是”Really Simple Syndication”(真正简易聚合)。现在已有的有Netscape, 1.0 (RSS-DEV版本),和 0.9x and 2.0 (UserLand Software版本) 0.9x和2.0。不过几乎所有能支持RSS的程序都可以浏览不同版本的RSS。

RSS 是基于文本的格式。它是XML(可扩展标识语言)的一种形式。通常RSS文件都是标为XML,RSS files(通常也被称为RSS feeds或者channels)通常只包含简单的项目列表。一般而言,每一个项目都含有一个标题,一段简单的介绍,还有一个URL链接(比如是一个网页 的地址)。其他的信息,例如日期,创建者的名字等等,都是可以选择的。

RSS是站点用来和其他站点之间共享内容的一种简易方式 (也叫聚合内容),通常被用于新闻和其他按顺序排列的网站,例如Blog。一段项目的介绍可能包含新闻的全部介绍,Blog post等等。或者仅仅是额外的内容或者简短的介绍。这些项目的链接通常都能链接到全部的内容。网络用户可以在客户端借助于支持RSS的新闻聚合工具软件 (例如NewzCrawler、FeedDemon),在不打开网站内容页面的情况下阅读支持RSS输出的网站内容。网站提供RSS输出,有利于让用户发 现网站内容的更新。

RSS如何工作?首先您一般需要下载和安装一个RSS阅读器,然后从网站提供的聚合新闻目录列表中订阅 您感兴趣的新闻栏目的内容。订阅后,您将会及时获得所订阅新闻频道的最新内容。 对于一般用户来说,用RSS订阅新闻可以像使用Outlook Express收取订阅的邮件一样简单;而对于Web应用程序的开发者而言,RSS的工作过程也不是那么复杂,至少比大多数其他常见的Web技术都更容易 被理解和被实现。 有人认为,RSS的初衷似乎是为了给邮件列表订阅服务以致命的打击,若从RSS的应用方式来看,这几乎是不可避免的。但从实际效果来看,RSS最火爆的应 用并非是商业信息的集中订阅,而是个人通过Web实现的信息聚合,一个典型的例子就是各国的网志作者(Blogger)首先成为最普遍的RSS应用人群。

想做站长吗?站长必须了解的基础常识!

什么是虚拟主机?

虚拟主机是使用特殊的软硬件技术,把一台运行在因特网上的服务器主机分成一台台虚拟的主机,每一台虚拟主机 都具有独立的域名,具有完整的Internet服务器(WWW、FTP、Email等)功能,虚拟主机之间完全独立,并可由用户自行管理,在外界看来,每 一台虚拟主机和一台独立的主机完全一样。我要安家为中小客户提供优质的网络环境和服务器,并由高级网管负责监控。

什么是ASP?

ASP即Active Server Page的缩写。它是一种包含了使用VB Script或Jscript脚本程序代码的网页。当浏览器浏览ASP网页时,Web服务器就 会根据请求生成相应的HTML代码然后再返回给浏览器,这样浏览器端看到的就是动态生成的网页。ASP是微软公司开发的代替CGI脚本程序的一种应用,它 可以与数据库和其它程序进行交互,是一种简单、方便的编程工具。在了解了VBSCRIPT的基本语法后,只需要清楚各个组件的用途、属性、方法,就可以轻 松编写出自己的ASP系统。ASP的网页文件的格式是.ASP。

什么叫FSO?

FSO (FileSystemObject)是微软ASP的一个对文件操作的控件,该控件可以对服务器进行读取、新建、修改、删除目录以及文件的操作。是 ASP编程中非常有用的一个控件。但是因为权限控制的问题,很多虚拟主机服务器的FSO反而成为这台服务器的一个公开的后门,因为客户可以 在自己的ASP网页里面直接就对该控件编程,从而控制该服务器甚至删除服务器上的文件。因此不少业界的虚拟主机提供商都干脆关掉了这个控 件,让客户少了很多灵活性。

继续阅读

域名的一些小知识,都非常的实用!

Status、Creation Date、Expiration Date
其中 Status 目前发现有8种状态,分别是:

1、ACTIVE:活动状态。由Registry设置;该域名可以由Registrar更改;可以续费;至少被指派一个DNS。

2、REGISTRY-LOCK:注册局锁定。由注册局设置;该域名不可以由注册商更改、删除;必须由注册局解除此状态才可以由注册商更改域名信息;域名可以续费;如果域名被指派至少一个DNS则可以包含在(域名根服务器)的区域中(可以正常使用)。

3、REGISTRY-HOLD:注册局保留。由注册局设置;该域名不可以由注册商更改、删除;必须由注册局解除此状态才可以由注册商更改域名信息;域名可以续费;该域名不包括在(域名根服务器)的区域中(不能正常使用)。

4、REGISTRAR-LOCK:注册商锁定。由该域名的原始注册商设置;该域名不可以被更改或删除;必须由注册商解除此状态才可以更改域名信息;该域名可以续费。该域名包含在(域名根服务器)的区域中(可以正常使用)。

5、REGISTRAR-HOLD:注册商保留。由该域名的原始注册商设置;该域名不可以被更改或删除;必须由注册商解除此状态才可以更改域名信息;该域名可以续费。该域名不包括在(域名根服务器)的区域中(不能正常使用)。

6、 REDEMPTIONPERIOD:宽限期。当注册商向注册局提出删除域名请求后,由注册局将域名设置称此状态,不过,条件是该域名已经注册了5天以上 (如果该域名注册时间不足5天,则立即删除);该域名不包括在(域名根服务器)的区域中(不能正常使用);该域名不可以被更改或清除,只可以被恢复;任何 其他注册商提出对此域名的更改或其他请求都将被拒绝;该状态最多保持30天。

7、PENDINGRESTORE:恢复未决。当注册商提 出将处于REDEMPTIONPERIOD的域名恢复请求后,由注册局设置;该域名包含在(域名根服务器)的区域中(可以正常使用);注册商提出的更改或 任何其他请求都将被拒绝;在7天之内,有注册商向注册局提供必需的恢复文件,如果注册商在7天之内提供了这些文件,该域名将被置为ACTIVE状态,否 则,该域名将重新返回到REDEMPTIONPERIOD状态。

8、PENDINGDELETE:删除未决。如果一个域名在被设置成REDEMPTIONPERIOD状态期间内,注册商没有提出恢复请求,那么,域名将被置于PENDINGDELETE状态,注册商对此域名的任何请求都将被拒绝;5天之后清除。

六度分隔理论

六度分隔(Six Degrees of Separation)理论。1967年,哈佛大学的心理学教授Stanley Milgram(1933-1984)想要描绘一个连结人与社区的人际连系网。做过一次连锁信实验,结果发现了“六度分隔”现象。简单地说:“你和任何一 个陌生人之间所间隔的人不会超过六个,也就是说,最多通过六个人你就能够认识任何一个陌生人。”
“六度分隔”说明了社会中普遍存在的“弱纽带”,但是却发挥着非常强大的作用。有很多人在找工作时会体会到这种弱纽带的效果。 通过弱纽带人与人之间的距离变得非常“相近”。

你 与布什之间相隔几个人?换一个问法,你通过几个人可以认识布什?如果说是六个人,你可能会不相信。但是这确实是来自一项社会调查的结论:哈佛大学心理学教 授 Stanley Milgram 在1967年做过的一次连锁信试验(链接到哥伦比亚大学今天用email进行的同样实验),实验的结果就是今天在社会关系研究中常说的“六度分隔”。你也 许不认识布什,但是在优化的情况下,你只需要通过六个人就可以结识他。六度分隔说明了社会中普遍存在一些“弱链接”关系,但是却发挥着非常强大的作用。有 很多人会体会到自己在找工作时候这种弱链接的效果。

Jon Kleinberg 把这个问题变成了一个可以评估的数学模型,并发表在自己的论文“The Small-World Phenomenon”中。我们经常在与新朋友碰面的时候说“世界真小”,因为往往可能大家有共同认识的人。Jon的研究实证了这个观点。

六 度理论的发展,使得构建于信息技术与互联网络之上的应用软件越来越人性化、社会化。软件的社会化,即在功能上能够反映和促进真实的社会关系的发展和交往活 动的形成,使得人的活动与软件的功能融为一体。六度理论的发现和社会性软件的发展向人们表明:社会性软件所构建的“弱链接”,正在人们的生活中扮演越来越 重要的作用。

现在六度理论应用比较多的出现交友网站。经常可以收到这样的垃圾邮件,打着六度理论或者SNS的幌子,邀请你加入交友俱乐部。好像你真的可以认识克林顿或者莱温斯基似的。

Gmail 的邀请模式是我很看好的一个模式。在这个模式下,你的朋友圈是稳定的,不断延伸的。当你收到了你朋友发给你的邀请信,注册成为Gmail的用户,你的 Gmail地址就会自动的进入你朋友的地址簿。这样就可能会发生一件很有意思的事情,你的朋友将来可能会收到一封Gmail的邀请信,这封信是你邀请的很 多层的某个下家发出的。这就是一个六度理论的应用。

另外一个六度理论可能运用的领域就是博客。博客是非常强调自我的,从某种意义上来说, 博客就是个人门户,它在实现着个人门户的很多功能。当然,目前我们所能接触到的博客功能上还有所欠缺,除了评论外,缺乏作者和访问者的沟通渠道。在一些博 客已经可以看到博客组成的圈子。志趣爱好相同的博客,他们会组成自己的小圈子,在小圈子内分享各种信息。如果能从功能上对圈子加以完善和提高,相信能对人 的交往很有帮助。比如可以在圈子内共享网络书签,RSS源;自动建立一个快速访问的好友列表;跟踪好友的最新发言等功能。这样“弱链接”会随着你们相互了 解的深入而变成“强链接”,这不就是我们所希望的么?

文章来自: 自然.而然

SEO简略教程

什么是SEO
SEO是英文search engine optimization的缩写.
它是遵循搜索引擎科学而全面的理论机制,对网站结构、网页文字语言和站点间的互动外交策略等进行合理的规划部署来发掘网站的最大潜力而使其在搜索引擎中具有较强的自然排名竞争优势,从而对促进企业在线销售和强化网络品牌起到作用。

SEO在国内的发展历程
第一个阶段,是中国的SEO神话起源阶段,其中有一个很重要的人:王通先生。是他一手制造了SEO的中国神话,因此吸引了很多人进入这个行 业。重要事件有:《王通:势做中国网络策划第一人》,报道中表明,王通先生2001年开始搞网站,短短几年,名动网络,本身也是一个神话。从他开始,中国 出现了一个新的行业:网络策划。也就是我们目前所认识的SEO,后来, “网络策划”这个词被埋没,在很长一段时间里,大多人的理解就是:SEO就是王 通,王通就是SEO。后来王通先生又创造了一个神话:“《搜索引擎排名秘笈》”,直接把SEO推上了神话的颠峰,此书价格为1200元。很快销售了几百上 千本,当时简直就有点洛阳纸贵的味道。在个人看来,学广告出身的王通先生在策划上的确有独特的操作能力,不愧为网络策划第一人。2003年11月,王通先 生创建了“通王科技”,专业从事网络策划,顺便提一下,这个公司名字很有意思,把王通两字的顺序颠倒一下就成了通王,从此王通先生在网络策划的领域开始了 他通向王者之颠的旅程。
第二阶段,是冯英健博士和胡宝介老师的黄金搭档。从两位的网站上了解到一些基本信息,经总结如下: 冯英健博士,1998年进入网络营销行业。著作较多,很多文章都来自实践总结,文风比较偏向科普味道,有点大学教授的学术作风,很朴实很实用。
胡宝介女士,1999年进入网络营销行业。她的成名之作,在我看来因该是她写的那本免费下载的《搜索引擎优化(SEO)知识完全手册》,写的非常好,很实用。
继续阅读

给新Blogger的五个锦囊

从我初次写博客至今,已经接近三年。一开始是把博客作为日记来写,后来搭建了这个独立博客,才开始真正的Blogger之路。论经验,我肯定不是最丰富 的,但是我觉得至少有一些小收获小感想也是值得拿出来与大家分享的。正好今天看到John Chow写的Beginner Blogging Tip,翻 译并略加修改,诞生了这篇给新Blogger的五个锦囊。

锦囊一:选择你愿意专注的话题

选 择blog主题很关键,和考大学选择专业一样,不要选择最热门最有前景的,而是一定要选择最能激发自己激情的方向。比如说,专注于写各种癌症的最近研究动 向肯定能收到很多关注,但若不是你所热爱,那将是痛苦的写作经验。以” 三秒改变世界”为例,我写我对互联网的观察,对blog的理解,还有对生活的感 悟。CBN Forum上正好有一个关于blog疲劳期讨论的帖子,其实我现在也处于半疲劳期,若不是因为这个blog上的话题都是我热衷表达的,恐怕自 己很容易就从疲劳期过渡到死亡期了…除此之外,因为Blog能够将志趣相投的一群人聚集起来,所以在blog上讨论你真正感兴趣的话题,这与你职业的发展 也能相辅相成。

锦囊二:内容才是王道

要想blog成功没有任何捷径,内容是唯一的王道。好的内容能够让你的文章被更 多人推荐、链接或转载,这些都是增加blog流量的途径。大多数高端的blog的读者都是通过RSS阅读,于是内容是唯一能够被读者接受并关注到的部分, 要想办法让你的内容充实且独特。做不到最迅速就做最详细,做不到最详细就做最真实,做不到最真实就做最幽默。如果都做不到,还是回家种田吧,=.=!!

继续阅读

增加RSS订阅数的13个方法

  1. 使用Feed烧录服务
    可以获得一个不变的RSS订阅地址方便日后搬家,同时还能统计订阅数。如果你使用独立Blog,并且有强劲的系统(wordpress和movable type)和稳定的服务器完全不必理会这点。
  2. 只提供一个订阅地址
    实现方法请参考第8点
  3. 写一篇文章
    标题叫《欢迎订阅我的RSS》,然后写上一堆有用的废话。对了,置顶后效果更好!
  4. 输出全文RSS
    这招完全是在讨好读者,对名气不大的Blog作用比较明显。
  5. 挂上各种订阅工具按钮
    相信我,读者大人们都”很忙”,如果你不够牛就乖乖照做吧。顺便介绍一个订阅按钮生成网站feedbutton
  6. 强化Feed的功能
    Wordpress用户可以尝试这一大堆RSS插件,Feedburner上也有几个优化选项(PingShot, SmartFeed, FeedFlare, BuzzBoost.)。至于Feedsky用户,请发扬自力更生的精神
  7. 使用显眼的订阅标志
    你可以像一样使用很素的模版,然后在侧边栏冒出一个大橙色的symbol。
  8. 加上RSS自动嗅探标签
    怎样征服像Firefox、Oprea、Maxthon这类自带RSS嗅探功能的浏览器呢?答案是在你的Blog模版的<head> </head>中间插入下面这段代码

    1
    &lt; link rel="alternate" type="application/rss+xml" title="Feed的大名" href="RSS地址" &gt;
  9. 提交到任何可以提交Feed的地方
    增加曝光率会对订阅数产生一定影响,要加强这种影响,请在feed的名称旁边加上”(推荐)”造成一种被推荐的假像。-这招跟你的人品有没有关系呢?
  10. 使用抓虾作为阅读器
    抓虾应该是目前国内用户最多的在线阅读器,出现在他们的”热文排行”的门槛很低,一般只要9个推荐就可以。该怎么做自己想像……
  11. 标题要吸引人
    一般我们看报纸都是先看标题然后再决定是否继续阅读。所以标题对于吸引RSS订阅者来说意义尤为重大,要知道有些rss阅读器只显示标题(有些则是用户自己设定成只接收标题信息,像我的抓虾就是)。
  12. 提供Email订阅方式
    虽然用这种方式的人不多,但加上去后感觉会更专业点。
  13. 显示Feed订阅统计图标
    不错的统计数字可以给新访客增加一个订阅你的理由,同时也会影响你在他们心中的地位和权威性。尽管那个可疑的统计图标是伪造出来的。

收藏自:Yee’s Blog

让Blog访问量翻倍的8个实用方法

1.使用一个合适的域名 - 域名是你网上的”身份证”,所有人(包括搜索引擎)就通过它来找到你。我们知道,网友之间口耳相传的威力是十分巨大的,谁都不能保证哪天你的Blog不会 突然得到一部分人的共鸣而为他们广泛宣传。而在这个”一传十,十传百”的过程中,简短易记域名的优势就现实出来了。

2.多给别人留评论 - 在这个以内容取胜的时代里,友情链接是很个非常脆弱的东西。与之相对的,评论正在不断的显示出其强大的生命力。一旦发现一篇主题跟你很接近的文章,那么你 应该本能地兴奋起来,因为捕获潜在读者的机会就在你面前了。对于这种天赐的机会一定要好好把握,绞尽脑汁,运用你最在行的那部分知识,给该文作者下一个” 强悍”的评论,这样还怕不能把他的读者吓到你的窝里去?

但是请记住,在具体实践过程中不要往人家的地盘倒垃圾!

3.坚持经常更新 - 这个办法其实任何人都想得到,不过并不是所有人都能做到的,能否坚持下去跟时间、精力以及信息获取渠道有关。一些理论性的东西相信大家都明白,下面就用以本站为实例,简单介绍一下Yee实践这个理论的方法。

就像大家看到的,本站的重头戏是 Blog指南,但是写这方面内容是很耗费时间的,光靠这一个栏目不可能保持较高的更新频率。所以,Yee采取横向发展策略,把覆盖面拓展到一切跟Blog 有关的事情。特别是 “Blog工具”和”Blog新闻”这两个分类,几乎天天都有内容写。这样不仅可以满足常客们的需求,更重要的是可以名正言顺地利用Digg类网站帮忙宣 传,吸引新的读者过来。

继续阅读

个人博客写作技巧

从煎蛋看到的,很有意思,可以说是一篇博客写作指南了,转过来,有时间细读。
不只是展示,展示并告知(Don ’ t Just Show , Show and Tell ):让你的文字谁(无论老手与菜鸟)都能理解,当文字无法把你的意思表达清楚的时候,适当地加上图片。

关键词、关键词、关键词(Keywords , Keywords , Keywords ):因为 谷歌发布了 博客 PageRank 专利[/url]、关键词必须比以前更加重视。

在 搜索网站的关键字时, Google 会对其标题标签( meta title )中出现的关键字给予较高的权值。所以你应当确保在你网站的标题标签中包 含了最重要的关键词,即应围绕你最重要的关键词来决定网页标题的内容。不过网页的标题不可过长,一般最好在 35 到 40 个字符之间。

可以点击的标题(Write Clickable Titles ):每篇文章的标题都是可以点击的,当然最顶部煎蛋的 Logo 也是可以点击的。扯远了,其实这里说的是:标题要简洁明了简明扼要,能吸引读者去看完全文,不要做标题党。

在 post 的前 200 词就把大意说清楚(Make Your Point in the First 200 Words ):如果你没有在开头的两三个句子就抓住读者,那么就会失去读者。

写博客就是剪辑(Blog Writing Is About Editing ):伟大构思不能自动写好,它是通过你的深思熟虑简明扼要地编辑才能成文的
。如果要表达的内容不多时,拿走那些会影响文章清晰度和可读性的修饰词。(除非你是为了搞笑,或者恶搞)

继续阅读