如何在北京租到满意的房子?
——京飘族北京租房完全手册
作者: 杨哲 Email: xiezilouAT126.com/yangzheATyangzhe.com
写于:2003/10 最后更新:2004/07/15
版权声明:可以任意转载,转载时请务必以超链接形式标明文章原始出处和作者信息及本声明
http://www.zolhouse.com/zufang10.html
关键词:北京租房 "北京租房信息" "北京租房 指南" "北京租房网"
"北京租房网站"
内容摘要:
北京的租房族尤其是京飘们面对各种媒体尤其是互联网上租房信息,以及不下几千家的北京的房屋中介公司,有没有技巧,如何才能租到满意的房子,概括如下:
- 了解市场:北京的外来人口日益增多,业主满目抬高房价,而求租者亦不知道如何评估一间房屋的价格;
- 找好中介:租房者不能在租房中把握好相对距离与绝对距离,致使造成工作与生活两不便;
- 签好合同:盲目追求一居室,三居室出租率低;
没有计划的事情永远是做不好的,主要原因在于大多数京飘族对北京租房市场不了解造成的:
其实大部分求租者只要通过一些简单的策略还是可以租到合适的房子的,准备在北京租房前的注意事项包括:
(注意:本网站设计本身就利用了其中一些方法)。
京飘族北京租房完全手册
何处是栖身之所?-京飘族租房完全手册
外面的世界很精彩,所以他们来到京城。外面的世界很无奈,何处才是栖身之所?
本报8月31日第28版刊登了题为《京城飘族租房咋这么难》一文,受到读者朋友的热情关注,
引起外地进京打工“飘族”的共鸣,有“飘族”成员询问,怎样才能在北京轻松地租到房子,具体应该怎么做等问题。
就此,本报特请京城放心中介之一我爱我家房屋租赁置换公司为“飘族”设计出一套租房完全手册,其中包括外地人在京租房步骤、知识及注意事项 等,希望能让“飘族”尽快找到自己的“家”。
Google の秘密 -
PageRank
徹底解説一文,PageRank简单的说类似于科技论文中的引用机制:谁的论文被引用次数多,谁就是权威。在互联网上PageRank就是基于网页中相互链接关系的分析得出的。
此外,从计算方法角度阐述PageRank机制还有这篇文章:http://pr.efactory.de/里面有更详细的PageRank算法说明和各种清晰的小型个案分析:
比如:子页中导航条的重要性
B
<=> A => C
Vs
B <=> A <=>
C (好)
页面数量因素:
B <=> A <=> C
Vs
F
<=\ /=> G
B <=> A <=> C (好)
D
<=/ \=> E
一个意想不到的结论:
(B <=> A <=>
C) ( E <=> D <=> F)
Vs
(B
<=> A <=> C) <=> ( E <=> D <=>
F)
PageRank升高的只是被链接的2个首页A和D,而网站子页面的PageRank平均会略有下降。同时:一个网站进入Google的索引量越大其受类似因素影响越小。
PageRank不对称的页面互链:
Google会用BadRank之类的算法进行纠正,而且一个网页着有来自“与其自身不相称”的高PageRank站点的链接,而自身又缺少足够数量和质量的反相链接的话,其PageRank会自动降低为0,A(pr=7)
<=> B(pr=0)
简单的说就是:偶尔要被权威站点反相链接不算数,要被足够多的权威站点引用才能提高自身网页的PageRank。
Web超链分析算法综述(南京大学论文)
更多论文可以通过搜索:“filetype:pdf google pagerank anchor text bayesian”得到
京城虽大,但其房屋租赁市场自有一定的规律性。“飘族”只要掌握这些规律,便可以在租房行动开始前做到心中有数。
通过搜索引擎推广自己需要注意以下几个方面:
- 房屋特点:北京市可供出租的房屋,年代普遍较老,以旧房为主。旧房多为小户型,房间与厅面积小。一居面积约35至40平方米,二居面积约55至65平方米,三居面积约70平方米。但麻雀虽小,五脏俱全,内部生活设施仍较为齐备。
但麻雀虽小,五脏俱全,内部生活设施仍较为齐备。比如:Yahoo!,dmoz.org等。其实这里有一个误区:不一定非要加入大型网站的分类目录才是网站推广,因为现在搜索引擎已经不再只是网站目录的索引,而是更全面的网页索引,所以无论来自其他网站任何地方的反相链接都是非常有价值的,哪怕是出现在新闻报道,论坛,邮件列表归档中。Blogger(Weblog的简称)们也许最深刻地理解了“链接就是一切”这句话的含义,由于Blog的内容之间有大量的相互链接,因此最经常被引用的
Blog页面在搜索引擎中的排名往往比一些大型商业网站的页面还要高。而wiki这样的文档管理系统更加突出了良好引用的特征。
- 房源分布:二环内位置虽便利,但可供出租房源多为平房;二环至四环为楼房主要集中区域,此处最为抢手;四环外为城乡结合部,总体条件较差。
其中,朝阳、海淀应该是“飘族”租房首选。ZDNet中国上,由于页面上有文章出处链接,相应网页和网站整体的PageRank过了一段时间后就有了很大的提升。有时候被什么样的网站引用有时候比引用次数多更重要。这里我要特别感谢的是,当时ZDNet中国是唯一遵循了我的版权声明的要求表明了文章出处,并且有反相链接的网站。
按照这个原则:能够名列Yahoo!和DMOZ这样的大型权威目录的头2层是非常有价值的。
- 价格特点:
北京房价按二环、三环、四环的次序依次递减。此外,同档次房屋,南城比北城略低300元。房租的支付方式,一般为季付或半年付。
- 租赁期限:北京市租房期限一般为一年,最少不能低于半年。
另外在推广自己网站之前也许首先需要了解自己网站目前在一些搜索引擎中的知名度,原理非常简单,可以参考如何评价网站的人气一文。
网站推广只是手段,如何突出内容、让需要相关信息的用户能够尽快的找到你的网站才是目的,PageRank高并不代表像Yahoo!这样的门户站点就能在所有搜索结果中排名靠前,因为搜索引擎的结果是搜索关键词在页面中的匹配度和页面的PageRank相结合的排名结果。因此第二个要点:如何突出关键词。
- 北京
租房首先要树立一个观念:外地人初来乍到,人生地疏,要找到满意的住所谈何容易?但通过正规的房屋中介,安置新家将易如反掌。 为什么要通过中介?
房屋中介熟悉市场情况,掌握着丰富的客户信息和房源信息,他们能根据房东与“飘族”的具体情况,促成二者之间的合理配对。中介公司还可以提供内容完备的租房合同供双方参考,以免日后产生不必要的纠纷。正规中介都聘有专业的不动产经纪人,为求租者提供房屋租赁服务,以保障双方当事人的合法权益及合同的正常履行。-中介怎样为“飘族”提供租赁服务?
中介服务各有不同,但作为正规中介,其服务流程都有章可循。 一般正规中介可为求租者免费提供房源信息,免费看房,促进双方成交。在求租过程中有何问题,都可向有关专家进行免费咨询。此外,中介还应为租赁双方提供协调关系的售后服务,以解除双方后顾之忧。
:
- 为什么查“新闻”,“汽车”之类的文字,各种门户网站的首页不在第一位?要知道他们的页面中都有相应频道的链接文字的
- 一篇新闻页面中,搜索引擎如何不通过模板匹配,自动将新闻的主体和页面中的页头,栏目导航条,页尾等部分的内容区分开的?
其实以上问题都可以归结为网页内容摘要的提取策略和关键词在其中的命中:
首先将能够描述一个页面内容的分成以下几种类型:
- 链入文字描述:inbound link
text
http://www.searchenginedictionary.com/terms-inbound-link.shtml
- HTML页面标题:title 好标题一般会将页面中最重要的关键词放在最前面,比如:ABC-10型吸尘器 - XX家电城
- HTML内容主体:content text
- 链出文字:outbound link text
如果按照以下规则:
一个页面中关键词命中权重:链入文字 >
HTML标题文字 > HTML页面主体内容 >>
出链文字,以上现象就比较好解释了。
链入文字是页面上看不见的,但链入文字对被链接页面有巨大的作用:在现代搜索引擎在关键词匹配的过程中,匹配的过程不只看当前页面的内容摘要:很大程度上,不只看这个网页自己说自己有什么内容,还要看别人如何链接时,如何描述你的网站别人怎么称呼你,比你自己说自己更重要。。
比如查:“世界卫生组织”,返回结果中有
http://www.who.int/ 而这个页面中是没有中文的,之所以能匹配上,是因为很多链接它的中文网站使用了:<a
href="http://www.who.int/">世界卫生组织</a>,所以,这个页面中不存在的中文关键词也成为了页面摘要的一部分。这样一想,就可以知道链出链接的文字其实是为被链接的子频道首页或者内容详情页服务的。对自身页面的关键词密度只有负面的影响,这也是Google建议一个页面中链接不要超过100个的原因:他根本不索引100个链接以后的内容。按照以上规则,搜索引擎将一篇新闻详情页中的新闻内容提取出来就是把页面上所有带HTTP链接的文字都去掉,就是新闻的内容部分了,更精确一些可以通过取最长文本段落等策略实现;而很多网站首页或频道首页中几乎全部都是链接,经过搜索引擎分析的结果就是:什么内容也没有,能够被命中的关键词仅仅是别人链接你用的“网站首页”和频道标题Title中的站点名称等的几个关键词,而页面中其他的文字则远远不如相应子频道和具体内容页面的匹配度高,而搜索引擎能够通过以上规则,让用户更快的直接定位到有具体内容的内容详情页面。因此希望通过一个首页,尽可能多的命中所有希望推广的关键词是不可能的。让网页尽可能多的进入搜索引擎的索引,然后把握好整个网站的主题风格是非常重要的,让网站的主题关键词能够比较均匀的按照金字塔模式分布到网站中可以参考:网站的主题金字塔设计
网站名称(用户通过1-2个抽象关键词)
/ \
子频道1 子频道2
(用户通过2-3个关键词命中)
/ \
/ \
产品1 产品2 文章1 文章2
(用户通过3-4个关键词命中:这种用户最有价值)
- 不要空着标题:空着<title></title>无异于浪费了最有价值的一块阵地;
传统的页面中,HTML页面中会有类似以下的隐含信息,用于说明当前网页的主要内容关键字:
<header>
<meta name="keyword" content="mp3 download
music...">
</header>
后来由于这种人工添加关键词的方式被滥用,大量网页中为了提高被搜索引擎命中的概率,经常添加一些和实际网页内容无关的热门关键比如:“music
mp3 download”等,所以新一代的搜索引擎已经不再关心页面头文件中的人工meta
keyword声明,而页面标题在搜索引擎的关键词的命中命中过程中往往有着更高的比重,如果一个关键词在标题中命中会比在页面中命中有更高的得分,从而在相应的搜索结果排名中更靠前。
- 标题长度和内容:不要过长,一般在40个字符以内,并充分突出关键词的比重;
如果更长的标题搜索引擎一般会忽略掉,所以要尽可能将主要关键词放在标题靠前的位置。省略掉不必要的形容词吧,毕竟用户主要通过名词来找到需要的内容。标题内容:尽量用一些别人可以通过关键词找到的字眼(也别太过头,如果标题中的字眼超过1半内容中都没有,有可能被搜索引擎排除出索引),因此基于web日志中来自其他搜索引擎的关键词查询统计非常必要。
- 如果网页很多的话,尽量使用不同的网页标题,争取让自己网站的内容更多的进入搜索引擎索引范围;
因为搜索引擎会根据页面内容的相似度把一些内容当成重复页面排除出索引范围;
http://www.chedong.com/phpMan.php是我的网站上的一个小应用:一个web界面的unix命令手册(man
page),在以前的设计中所有动态页面使用的都是同样的标题:"phpMan: man page /perldoc /info page web
interface" ,Google索引了大约3000多个页面,后来我将页面标题改成了"phpMan:
[命令名]"这样的格式,比如:"phpMan:
ls",这样大部分动态页面的标题就都不一样了,一个月后Google从这个页面入口索引了大约6000个页面。因此,如果网站中很多网页都使用相同的标题,比如:“新闻频道”,“论坛”,这些页面中很大一部分就会被排重机制忽略掉。
- 除了<title></title>外,还可以用<h1></h1>标题行突出内容主题,加强标题的效果;
在我的网站设计中:我会把用<h1>[标题]</h1>这样的模板把标题突出显示,而不是通过改变字体的方式突出标题。
- 什么是房屋银行?:
“房屋银行”是房屋租赁服务的一种新方式,即房主将闲房存入“房屋银行”,无论出租与否,“房屋银行”都将按评估的租金价格,扣除适当的租赁工作期外,按月将租金回报支付给房主;而求租者无需缴纳任何服务费即可在“房屋银行”中任意选择房源并找到满意的房屋;业主将自家闲置的产权房存入“房屋银行”,按期收取租金回报,让房屋像存款一样升值。
在北京以房屋银行行使从事租房业务的中介公司只占一小部分,其中有:大部分搜索引擎都认为静态链接的网页是优质网页,Google在优先抓取索引的网页中70%以上是不带参数链接的静态网页。而且即使同样的内容,静态网页也会比动态网页权重高:很容易理解:query?a=1&b=2这样的链接由于参数顺序颠倒的query?b=2&a=1完全相同。尽量使用静态网页:目前能够动态网页进行全面的索引还比较难,而即使是Google也更不会索引所有的内容,因此很少会对参数超过2个的动态网页进行进一步的抓取和分析。以下是一个phpBB论坛页面返回的HTTP头信息:
HTTP/1.1 200 OK
Date: Wed, 28 Jan 2004 12:58:54 GMT
Server: Apache/1.3.29 (Unix) mod_gzip/1.3.26.1a PHP/4.3.4
X-Powered-By: PHP/4.3.4
Set-Cookie: phpBB_data=a%3A0%3A%7B%7D; expires=Thu, 27-Jan-2005 12:58:54 GMT; path=/;
Set-Cookie: phpBB_sid=09f67a83ee108ecbf11e35bb6f36fcec; path=/;
Content-Encoding: gzip
Cache-Control: private, pre-check=0, post-check=0, max-age=0
Expires: 0
Pragma: no-cache
Connection: close
Content-Type: text/html
为了避免隐私问题:Googlebot可以通过对页面http header中的session id和session
cookie进行一些甄别,这样很多需要认证信息的论坛内容就无法进入索引了。
总体上说Google喜欢新的,静态的内容。因此无论从效率上讲还是方便搜索引擎收录:使用内容发布系统将网站内容发布成静态网页都是非常必要的,从某种程度上说google
friendly = anonymous cache
friendly。
比如:http://www.chedong.com/phpMan.php/man/intro/3
比http://www.chedong.com/phpMan.php?mode=man¶meter=intro§ion=3这样的链接更容易进入搜索引擎的索引。而且在URL中的命中也能突出关键词。
- 房屋银行与普通租赁业务的区别在哪里?-1.求租人免缴任何中介费。求租者不必再为支付中介费而苦恼;而普通业务一般需要求租人缴纳相当于一个月的房屋租金作为中介费。“房屋银行”的房屋全部由中介机构免费进行清洁、消毒,保证居住环境的卫生整洁;而普通业务的房屋一般是保持房屋原状,中介不提供此项服务。
。
#!/bin/sh
YESTERDAY=`date -d yesterday +%Y%m%d`
# for FreeBSD: YESTERDAY=`date -v-1d +%Y%m%d`
LOG_FILE='/home/apache/logs/access_log'
grep -i Googlebot $LOG_FILE.$YESTERDAY|awk '{print $7}' |sort | uniq -c | sort -rn > spider/$YESTERDAY.googlebot.txt
grep -i baiduspider $LOG_FILE.$YESTERDAY|awk '{print $7}' |sort | uniq -c | sort -rn > spider/$YESTERDAY.baiduspider.txt
grep -i msnbot $LOG_FILE.$YESTERDAY|awk '{print $7}' |sort | uniq -c | sort -rn > spider/$YESTERDAY.msnbot.txt
grep -i inktomi $LOG_FILE.$YESTERDAY|awk '{print $7}' |sort | uniq -c | sort -rn > spider/$YESTERDAY.inktomi.txt
grep -i openbot $LOG_FILE.$YESTERDAY|awk '{print $7}' |sort |uniq -c | sort -rn > spider/$YESTERDAY.openbot.txt
- “房屋银行”的房屋由中介免费简单装修,入住时焕然一新;而普通业务的房屋则由租赁双方协商是否提供此项服务。
- 房屋由中介免费提供财产保险,解除双方后顾之忧;而普通业务没有这项优惠。
房屋由中介免费提供财产保险,解除双方后顾之忧;而普通业务没有这项优惠。
- “房屋银行”的租房期限至少为一年以上,这样能确保居住环境的安全稳定;普通业务则无法保证固定的居住期限,租赁双方可以协商。
:站点地图,
5.“房屋银行”的租房期限至少为一年以上,这样能确保居住环境的安全稳定;普通业务则无法保证固定的居住期限,租赁双方可以协商。
- 为保证交易的安全性,“房屋银行”的付款方式是押二付三,即求租方需交纳两倍月租款作为房屋押金,暂时押于“房屋银行”,退还日期为合同规定租期满后顺延一个月,且该押金不冲抵房款。普通业务无此项要求,也无法最大限度的保证业主的利益。
:为保证交易的安全性,“房屋银行”的付款方式是押二付三,即求租方需交纳两倍月租款作为房屋押金,暂时押于“房屋银行”,退还日期为合同规定租期满后顺延一个月,且该押金不冲抵房款。普通业务无此项要求,也无法最大限度的保证业主的利益。
- “房屋银行”租金交付方式为季付,将求租者来回支付房租的车马之劳减至最低限度;而普通业务则由租赁双方协商:“房屋银行”租金交付方式为季付,将求租者来回支付房租的车马之劳减至最低限度;而普通业务则由租赁双方协商。
- 文件类型因素:“房屋银行”租金交付方式为季付,将求租者来回支付房租的车马之劳减至最低限度;而普通业务则由租赁双方协商。
- “房屋银行”租金交付方式为季付,将求租者来回支付房租的车马之劳减至最低限度;而普通业务则由租赁双方协商。
找房不仅仅可以通过自己找,还可以通过从事租赁业务的中介公司租房。目前,北京市相关部门针对北京房屋租赁市场的实际情况制定了一些政策,加强了政府监管,相信通过找有良好信誉的中介租房会事半功倍
。
具体的步骤如下:
- 选择放心中介:
租房的时候选择正规的中介,可以避免求租者的合法权益遭受损害。北京持有执照的房地产中介公司近2000家,其中的1000余家是非资质中介公司,这些害群之马让外地求租者深受其苦,所以选择一家正规中介尤为重要。
选择正规中介,首先要看中介公司是否有营业执照;其次,注册资金也决定了中介公司的实力和规模;最后,还要看中介公司的业务服务是否专业、标准。
- 登记求租信息:为确保租赁交易的安全合法,“飘族”登记求租意向前,需提供以下材料:本人身份证、家庭(原籍)地址及电话、北京所在单位地址及电话。
个人资料经核实无误后,求租者即可按照个人要求登记租房信息。电脑将信息配对、验证,并由指定经纪人与求租者进行沟通,按需提供服务。通常在一周之内,就能租到满意的房子。
- 选择业务方式:
如今一些正规中介公司推出了租房新的业务方式,例如,普通租房方式、入房屋银行求租等。与中介公司选派的经纪人充分沟通后,“飘族”可根据自己的经济收入、租房要求等情况选择不同的租房方式。(下面是按普通方式的步骤进行)。
- 签租房合同预付佣金:与正规中介签订《房屋承租委托书》,并预付服务佣金,金额相当于一个月的房屋租金。
北京市房屋租赁市场与上海等其它城市不同,房子少而求租者多。北京市外来人口约300万,而能合法出租的房子却较少,所以北京多数中介向求租者收取服务佣金,金额一般为一个月的租金。
- 与房东预约看房:
如果有感兴趣的房源信息,求租者便可通过经纪人与房东预约实地看房。鉴于很多房东都是上班族,看房时间不多,所以最佳时间是周末或下午下班后。
房东们都希望将房子租给高素质的房客,因此在看房过程中,求租者要提前讲清租房的人数及身份,尤其要注意个人形象与谈吐。为配合经纪人的工作,尽快找到满意的住所,求租者应注意:不与房东交换联系方式。
- 办完所有手续:如果对房子满意,求租方与出租方即成交。第四步预付的服务佣金将在求租方与出租方成交后,按实际成交额多退少补,若在委托期内中介公司未能为求租方租到满意房屋,在委托期满后第二天即全额退款。
通过这样的步骤一般就可以保证租房交易整个过程的安全。
现在,已经有越来越多的专门提供租房信息的网站,这些网站往往对于求租者提供完全免费的房屋出租信息,比如北京租房专业网站中关村公寓网 北京租房信息网等已经有一定知名度的租房网站,登陆这些网站可以找到免费的房屋出租信息,而且他们的租房信息一般都经过人工核实,真实性很高?
以下是在北京专门提供租房信息的网站列表:http://www.chedong.com/log/2003_6.log
需要注意的是:由于网络信息的随意性
并不是所有的网站都能花费人力物力去核实所有的房屋出租信息,所以求租者需要掌握一些判断网上信息真实性的技能,中关村公寓网有关于如何判断租房信息真实性的精辟论断:
经纪人杨哲发表在中关村公寓网的——北京租房密笈
从事房地产经纪业务这么多年,也帮助过不少租房的客户租到了满意的房子。
现总结接触过的一些实例,按照客户类别把在北京租房过程中的一些注意事项介绍给大家,希望对大家有所帮助。
现在北京很多租房论坛里面有一部分黑中介冒充个人对外发布出租房屋信息,所以在找到几条自己认为比较合适的租房信息以后,要注意考察其真实性,
打电话的时候要讲究方法,你可以这样问“请问您有房子出租吗?”对方如果是中介的话,往往会问“要哪的房子啊?”(真实的房主怎么会问是哪里的房子呢?),
。
这个时候你不要告诉他你要租哪里的房子,其实这个时候你就可以挂断电话了,但是如果你还有兴趣的话,
你还可以这样回答“哦,我在网上看到你有套房子出租”(不要告诉他是在哪个网站上看到的)。这个时候如果他是真实的业主就会把出租房屋的情况告诉你,或则问你是做什么工作的,租房作什么用,
但是如果他是中介,他往往会问“在哪个网上看到的?”(因为发的租房信息太多了,记不清)或则继续问你要租哪里的房子,这个时候你就可以义无反顾的挂断电话了,理都不要理他
虽然Google
新闻的内部算法至今没有公开,但是人们猜测这种完全由机器所搜集的头条新闻应当不是Google搜索引擎中惯用的鸽子算法,很可能与这种“突发”判断算法有关。如此说来,Google收购Blog工具供应商的举动确实还有更深层次的远见了。
- NewScientist.com news, Word 'bursts' may
reveal online trends
- 还没有写完这些介绍,在 SlashDot
上也看到了很多有关这个发现的讨论
- Make a site with a clear hierarchy and text links. Every page should be
reachable from at least one static text link.
让网站有着清晰的结构和文本链接,所有的页面至少要有一个静态文本链接入口
批注:尽量不要用图片和JAVASCRIPT
- Offer a site map to your users with links that point to the important
parts of your site. If the site map is larger than 100 or so links, you may
want to break the site map into separate
pages.
为用户提供一个站点地图:转向网站的重要部分。如果站点地图页面超过100个链接,则需要将页面分成多个页面。
批注:索引页不要超过100个链接:SPIDER只考虑页面中头100个链接
- Create a useful, information-rich site and write pages that clearly and
accurately describe your content.
用一些有用的,信息量丰富的站点,清晰并正确的描述你的信息。
- Think about the words users would type to find your pages, and make sure
that your site actually includes those words within
it.
想像用户可能用来找到你的关键词,并保证这些关键词在网站中出现。
批注:少用“最大”,“最好”之类的形容词,用用户最关心的词,比如:下载,歌星名字,而不是一些抽象名词。
- Try to use text instead of images to display important names, content, or
links. The Google crawler doesn't recognize text contained in
images.
尽可能使用文本,而不是图片显示重要的名称,内容和链接。GOOGLE的机器人不认识图片中的文字。
- Make sure that your TITLE and ALT tags are descriptive and
accurate.
保证:页面的TITLE和ALT标记正确的精确描述
- Check for broken links and correct HTML.
检查坏链并修正这些HTML错误。
- If you decide to use dynamic pages (i.e., the URL contains a '?'
character), be aware that not every search engine spider crawls dynamic pages
as well as static pages. It helps to keep the parameters short and the number
of them
small.
如果你打算使用动态页面:链接中包含"?",必须了解:并非所有的搜索引擎的机器人能想对待静态页面一样对待动态页面,保持动态页面的参数尽可能的少也会很有帮助。
- Keep the links on a given page to a reasonable number (fewer than
100).
让一个页面中的链接少于100个。
批注:用lynx -dump http://www.chedong.com
可以模拟从robot角度看到的页面。其最后有链接统计
输出类似:
[1]Google Free Search
_______________________________ Google Search
(_) Search WWW (_)
Search chedong.com
更 新 [2]站点地图 / Site Map [3]留 言簿 / Guest
Book [4]意见反馈 /
Feed Back
...
References
Visible links
1.
http://www.google.com/services/free.html
2.
http://www.chedong.com/sitemap.html#sitemap
3.
http://www.chedong.com/guestbook/
4.
http://www.chedong.com/formmail.htm
...
Hidden links:
50. http://www.chedong.com/bbcweb/
...
搜索引擎的宗旨在于提取互联网中质量最好的内容提供给用户,任何有利于帮助用户获得相对公正,优质内容的策略都是搜索引擎追求目标。PageRank是一个非常好的策略,但是并非所有策略都是基于非常复杂的算法。
从搜索引擎看来什么是互联网中“好”的内容呢?
- 首先:互联网大约是8G个网页,而且以每天2M的速度增长的。其中80%以上是动态网页,而占总量20%的静态网页就是一个相对比较简单的过滤规则。
- 其次:用户友好(User
friendly)也是很重要的方面,搜索引擎利用算法帮助提升这些优质网站,包括:通过CSS将内容和表现分离:较少的javascript和frame结构,spider本身也很难深入抓取这些网页:Javascript和frame结构大部分是广告。
- 标题明确:无标题,重复标题或者标题SPAM(类似于:游戏游戏游戏游戏游戏游戏这样的标题)进行过滤或降低得分页面大小:因为页面过大会导致用户下载缓慢,所以很多引擎只计算页面大小在100k以内的网页。
- 链接引用:不仅需要有链接链入,也需要帮助用户找到其他更有价值的内容;
- 文件类型:PDF和DOC等专业文档和来自edu,gov等非赢利网站的内容;
- 链入网站的文字:所有用户不可见的因素全部被忽略。此外:用户搜索的行为本身也被Google记录,可能对目标网站的主题相关度有帮助。
参考资料:
北京租房必读
http://www.zolhouse.com/zufang7.htm
北京租房注意防陷阱
在北京租房咋这么难?-“飘”一族的苦恼
http://www.zolhouse.com/zufang2.htm
胡有财十年北京租房之最
http://www.zolhouse.com/newsdetail13.htm
北京租房视线---漂在京城的美女们
http://www.zolhouse.com/newsdetail15.htm
洋妞北京租房记
http://www.zolhouse.com/zufang38.htm
嬉笑怒骂之北京租房
http://www.zolhouse.com/zufangzatan7.htm
这篇文章是在查"Google
PageRank"的时候查到的,这篇文章不仅有一个算法说明,也是一个Google的weblog,记录了很多关于Google的新闻和一些市场动态信息。
Google 的秘密- PageRank 彻底解说
中文版
恋爱似租房:
http://www.zolhouse.com/zufangzatan5.htm
关于印发房地产经纪机构代理房屋租赁须委托银行收、付租金的暂行办法的通知
http://www.zolhouse.com/zufang37.htm
《北京市房屋出租代理合同》示范文本
http://www.zolhouse.com/zufanghetong-7.htm
《北京市房屋租赁合同》示范文本
http://www.zolhouse.com/zufanghetong-8.htm
搜索引擎通过一种程序robot(又称spider),自动访问互联网上的网页并获取网页信息。您可以在您的网站中创建一个纯文本文件
robots.txt,在这个文件中声明该网站中哪些内容可以被robot访问,哪些不可以。
反Google站点:观点也很有趣
http://www.google-watch.org/
关于Google的WebLog
http://google.blogspace.com/
关于Google的HillTop算法
北京租房相关论坛
http://www.zolhouse.com/bbs/index.asp
http://www.010zf.com/bbs/
http://www.esf.com.cn/bbs/
原文出处:<a
href="http://www.zolhouse.com/zufang10.html">http://www.zolhouse.com/zufang10.html</a>
<<返回
<<返回首页