-
[网站研究工具]-网站时光倒流机
2007-06-06 10:52:32
网站时光倒流机器,也有人叫它“网站档案馆”-网站研究工具之一,网址为:
http://www.archive.org/web/web.php
这个工具来自于互联网档案馆(The Internet Archive),自1996年成立起,The Internet Archive定期收录并永久保存全球网站上可以抓取的信息。对于不同的网站,其收录的网页数量和收集周期也不相同,一些大型网站可能每天都会被“备份” 一次,每次可能收录数十个以上的网页,而一些小型网站可能每年收录几次,每次只有几个网页。对网站不同时期的历史资料进行研究,是互联网档案馆最大的价值 所在。
因为一个网站不可能是一尘不变的,一个网站在其不同时期会有不同的内容和版本,同一时期同一领域的不同网站也会有优劣之分,互联网试验室就相当于一个历史大型数据库,便于进行网络营销研究。
目前其的alexa的排名是235,可见有很多用户来使用其有价值的免费资料。
但是由于网站中可以查看的内容一般是静态内容,如果需要用户登录才能查看的网页,以及动态生成的网页,是无法被收录的, 由于互联网档案馆忠实地记录了一个网站不同阶段网站的基本结构和内容,如果网站上曾经有一些后来不太希望再出现的信息,这种历史也是无法改变的。
我上网搜索了一下中文的网站,似乎只能展现出网页的基本框架,但是内容却均显示为乱码
。而且目前最新的网页数据是到2006年的
-
[转]技术:竞争的核心
2007-02-07 10:39:19
在Google出现之前,Yahoo是当之无愧的老大(当然,跟hao123差不多样式的Yahoo仍然是老大,但它在搜索引擎领域里被Google甩 了),永远不会有亘古不变的老大,Google颠覆了搜索引擎领域,几乎占据了搜索市场的大半江山。然而,至今没有几个人清楚Google的神奇算法。究 竟是什么机制赋予了Google神奇般的力量。
一直以来,人们有几种猜测。昨天,etarip讲述了他的理解。
etarip先给我解释了多核的作用,“其实,如果你是个PC用户,多核对你来说是个革命。但是对于服务器而言,多核是N年前的事情。为什么?因为这么大 的数据流量,单核怎么负荷得了?!Google之所以强,我猜它的核心是多台廉价PC能够将数据资源分配、匹配。它有个‘PC庄园’,这里面的每台机器都 分担着一部分网络资源,像是堆在一起的灵活的积木一样,如果哪个积木条被抽掉了,它的资源可以自然转移到其他PC上,于是多一台少一台机器,也就是多一个 核少一个核对于Google来说没有任何影响。而这种能够合理分配、匹配数据资源的算法就成为Google颠覆搜索引擎领域的核心。随之,Google的 蜘蛛功能可以抓取每个网页上的每个链接,再分析关键词的权重,进行匹配和分配……事实上,目前搜索引擎领域里,照猫画虎的事情很多,但是了解核心算法的人 却寥寥无几,这就造成了为什么搜索引擎领域里总是只有那么几个寡头在控制着市场。正因为,对于市场而言,垄断是可怕的,所以,一些非营利组织公布了一些开 源的算法。它正培植着很多新型的搜索引擎公司……”
其实,占领市场的核心是技术上的超越。Google仍在不断研发新算法,Google需要自己颠覆自己.
Baidu实际上占据了双重优势,一个技术,一个本土优势。相比之下,Baidu更了解中国人的搜索习惯,它以中国为核心,再慢慢拓延。
Google不同,它以中国为一颗重要棋子,战略眼光投在全球的每个角落。也就是Google也许不会因为中国而做战略上的大逆转,这种艰难的取舍导致了Google在中国的市场只有Baidu的1/3。
但未来不同,人可以变,谁主江山,无从知晓。唯一可以确定的是,技术领跑市场,在用户需求决定市场方向的同时,技术革新也在改变着用户需求…… -
百度门户新闻 期待另类风格
2007-02-05 12:09:55
【eNet特约评论】有关百度即将大规模向门户模式嬗变的消息近来成为中国互联网一大热点,尽管百度自己犹抱琵琶半遮面,但是多位高层暗示、网络新闻牌照顺利到手等各种迹象表明,百度从搜索引擎向综合门户转变似乎已经是大势所趋。
无疑,新闻转载(非采编网媒)业务将是百度完成这个转变的标志性事件。历史上,早期中国网络服务的缺乏让几大门户网站获得了一个“新闻门户”的不准确称 谓(Portal已是无所不包),插入新闻页面的广告也成为门户网站的最重要的收入来源。而对于百度来说,目前已经提供了聚合标题的新闻服务,如果走向门 户,聚合标题势必将走向新闻全文转载。
从去年开始,面临搜索广告市场增长缓慢之苦的百度公司开始挖掘现有的流量和人气资源,以影视、音 乐、杀毒等产品杀入传统门户的领地。但是迄今为止,百度的新闻频道仍在充当向大小网站贡献流量的“慈善家”。显然,在张朝阳总结出的“华尔街大棒”之下, 百度长期当不了“慈善家”的角色。
我们关注的是,百度公司将以什么样的一种模式和风格跻身新闻转载业务。
传统门户的新闻转 载模式并不复杂,拷贝文章、修改一个煽情(不管多么违背新闻学)的标题、在新闻网页中插入几十个花里胡哨的广告,然后坐等网民前来点击。这种运作模式对于 运营者来说出了人力之外没有什么技术要求。由此我们看到,QQ推波助澜的腾迅网“坐着火箭”进入了门户三甲,不仅霸占了搜狐的位置,更是在流量上将新闻转 载“鼻祖”新浪抛在身后。腾讯网的旱地拔葱表明,这种业务模式并无法成为门户网站的核心竞争力,这也是新浪未来更大的危机所在。
百度新闻转载还要复制腾讯的成功道路吗?
从“转载插广告”的模式来说,百度似还无法超越。但是在新闻转载业务的运作风格上,笔者认为百度应该坚持现有的“简洁”个性,给网民奉献出一个焕然一新的新闻频道来。
纵观今天中国四大门户网站,其新闻业务已经走入了两个误区,一个是“繁杂”,另外一个是“贪婪”。百度只需要避免这两个误区,即可以从这四家门户大把转移读者。
笔者用Photoshop对新浪新闻的首页进行了测量,其长度已经超过了1万个像素,对于800X600分辨率长度为20个屏幕,对于1024X768 分辨率则是13个屏幕。这种新闻的呈现在阅读乐趣之前首先给人带来一种眼花缭乱的“繁杂”。其他几大门户的首页拷图也莫不是“电线杆”一根。
至于“贪婪”,相信每一个阅读网络新闻网页的读者都会有这一感受。进入页面宛若进入了一个广告天堂,各式各样的广告就好像陈佩斯小品里的配角一样,争先 恐后地争夺你的注意力,Flash广告上上下下,震耳欲聋的视频广告更是把你惊出一身冷汗。由于关闭各种遮挡文字的Flash广告实在浪费时间,笔者有时 只好一毙了之。
门户新闻的“贪婪”还表现在将一则新闻尽可能分割成多个网页。这种做法,不仅增加了堆砌广告的机会,还可以增加流量,提高在Alexa的排名,又赚钱又赚排名,何乐而不为?
由此分析,百度的新闻转载业务或许有三个方面可以做到独树一帜。其一是控制首页的长度,目前聚合标题的百度新闻频道已接近这一点。其二是减少广告插入 量,最具“轰动性”的策略是每一个新闻网页仅插入一个图片或Flash广告,最大限度减少视觉污染,其三,坚决摒弃分页恶习,尽可能在一个页面中显示完全 文。
除了新闻呈现方式上的另类之外,在和传统媒体(电视、电台、报纸)的合作方面,百度仍然有革新的空间。例如,今天几大门户通过支付固定年费获得转载授权,百度完全可以尝试“免费转载、广告共享”的方式,让每一则新闻的劳动创造者分享点击广告收入。
综上所述,今天的门户新闻服务由于克隆新浪而步入了若干集体误区,这种网络业务仍有广阔的提升空间,而百度的“简洁”天性正是治疗门户新闻“繁杂贪婪”症的良方。中国的网络新闻读者要一种“清静、舒适”的阅读体验,我们期待作为后来者的百度能填补空白。 -
[转帖]阿里巴巴开始做行业分站了!
2007-01-28 20:11:17
作者:田克山
今天去阿里巴巴网站闲逛,看到一条信息,刺痛了我的眼睛!信息如下:http://club.china.alibaba.com/forum/thread/view/25_21721914_.html?tracelog=club_homehot_mao
邀请函
各位商友,为了让大家在2007年“赢”的更多,我们将推出全新的食品分站。欢迎大家参与投票并发表自己的想法。
调研目的:
1、整合食品商机、食品资讯、食品论坛、餐饮论坛,建立食品分站首页。
2、通过投票了解食品商人的需求。
3、倾听更多商人的专业意见。
调研方式:
1、什么样的食品内容是您最需要的? (请点击投票)
2、食品分站需要怎样的一个氛围? (请点击投票)
3,分站如果建立一个新品展示区,您是否愿意无偿提供食品样品? (请点击投票)
4,我要发表看法,赢取最高奖品。 (请直接跟贴)
调研时间:2007年1月23日-1月30日
参与形式:投票、跟贴
奖品设置:
一等奖:2000点财富值+ 食品分站首页相关推荐位2周(1名)
二等奖:1000点财富值+ 食品分站首页相关推荐位1周(2名)
三等奖:500点财富值(3名)
优秀奖:财富值奖励不等(人数待定)
注:我们将在活动结束后一周列出获奖名单并展示其建议,并赠送相应财富值。
感谢花竹帽提供精美设计
阿里巴巴·中国·网站运营
2007年元月23日
看 完此信息后,我们马上就知道阿里正准备走行业细分的路,再也不会像以前那样,把各个行业整合在一起,自称B2B门户网站,我估计阿里会把各个行业独立成立 一个部门或者一个运营中心,对行业的资讯、新闻、展会、供求信息、销售团队、技术等都独立的运营,就相当于一个小型的行业B2B网站公司了,同时独立的行 业运营中心,借助阿里巴巴现有的品牌和口碑以及各种资源,我们可以想象,假如阿里巴巴把现有的六十个行业进行细分的话,那是多么可怕的事情,因为阿里的资 源和品牌等那么强大,将会使一大批行业B2B艰难的生存。
为什么阿里巴巴现在要把行业进行独立出来呢?
第一:恐怕 是看到许多行业B2B网站的市场前景,自从进入B2B领域后,接触许多的B2B网站,许多像阿里巴巴和慧聪明以及买麦网和万国商业网等,都号称B2B门 户,但是他们都有一个共性,那就是亏本不赚钱,而一些行业类的B2B网站却在疯狂的赚钱,虽然行业B2B网站的名气和流量不比门户B2B多,但是赢利却比 门户B2B多几百倍,活的特别滋润。
第二:虽然对阿里巴巴公司内部的运作情况不很了解,以及公司架构不很了解,但是我们却可以发现, 在阿里没有独立各行业的时候,人员结构和信息规划以及市场销售,都是按照行业来分工的,比如行业资讯和行业论坛等,以及行业数据和行业展会,各个版面的内 容都有巨大的差异,所以也预兆着,阿里的内部运作已经是以行业为主,各自独立运营者。
第三:现有的资源和品牌是各行业分开和独立运营的扎实基础。从行业资讯、行业供求信息、行业论坛以及行业展会等各个方面,阿里的各个行业都具有丰富的运营经验和行业资源,从流量和品牌已经口碑等都不错了,这个也是为阿里进行行业细分提供了扎实的基础。
第四:各行业独立分开可以给市场更好的服务。假如各个行业独立分开的话,笔者估计,从产品开发以及服务和市场宣传等,都有更高的提升,因为各个行业的实际情况不一样,假如阿里全部以一样的服务对待的话,恐怕会失去市场,而进行行业独立分开,可以给市场带来更好的服务。
第五:各个行业分开,更有利于公司内部的竞争机制以及提高整体竞争力。假如各个行业独立分开的话,从运营角度来说,各个行业更有独立权,更能发挥各个行业工作人员的积极性,同时可以形成一个有效和健康的公司内部竞争机制,有效提高竞争力。
其 实我们认真分析的话,会发现阿里这样的做法是十分有利的,也是必然发展的一个趋势,同时对于其他网站来说,也是一个很值得借鉴的方法。但是阿里的这种做 法,给许多行业B2B网站带来了巨大的挑战,所以行业B2B网站面临着一场更大的竞争和对手,同时行业B2B网站又该如何做呢?是不是也学阿里对行业更细 的领域进行独立运作呢?
不可否认,未来网站的发展趋势和主流就是市场细分,不仅是市场的细分,更是服务的细分,并且还是目标客户的细分,因为社会分工越来越细是人类社会进步的表现之一。
希望有更多的朋友可以进行探讨!心情不好,懒的去写那么多了!就到此为止!作者BLOG:http://jomocn.blog.sohu.com
另外一个很有意思的评论:
至 于阿里做分站的这事,我倒觉得没那么可怕,毕竟内容上其实一直是分着的,资讯早已分而治之,进一步再想,慧聪不是就从分站集合体开始做的么,所以我认为这 个思路的杀伤力现在还很不明朗,因为搜所决定一切,大部分人都是去搜索商机和供应信息的,或者是通过贸易通来交流以取得商机,所以从严格意义上来说分站的 意义并不是显得那么大了,分站的很大一部分意义我看就是要把一些没法同质化的产品分开来以便用户能够更准确翔实的获取资料,就从食品说起,食品的很多产品 参数、应用环境、上下游通道和其它的大不相同,所以做分站好处自然多,但是效果我认为已然有限。
人家的定位是研究出来的,不是靠无凭无据的想象出来的!
因为频道拿出来就意味着要深耕细作,这样直接就面对了行业门户,有些行业能拼的过,有些行业再使劲也恐难有作为,行业自有其道,不是通过大而全而积累的经验就能搞定的。 -
[转帖]从豆瓣网站设计谈网站重构
2007-01-24 10:45:03
douban.com非常精巧的应用了div+css,并且通过色系的运用,最大限度减少图片等等方式既使得网站页面清新可人,而且可以最大限度的压缩了网页的大小,从而使得访问的效率得到了最大化。
第 一次看douban.com,有一种拿着“读书”杂志在手上阅读的感觉,很素雅,好像还有那么点书香气息。被中国式网站强奸得都习以为常,以为网站也就这 样而且也只能这样,无疑好多人第一次看到douban.com的时候都会被他的网站的简洁所触动,都会感觉眼前一亮!为什么会这样呢,于是有些想法,来看 看douban.com的网站设计方面的东西,看看他到底是怎么做的呢:
1、采用div+css的页面技术,从”网站重构“一书翻译以来,此种布局方式已经开始深入人心,好处不多说(可以访问ajie的w3cn.org 了解),可说web2.0必备。
2、通过色块底色来突出整块内容,重要颜色有浅粉,浅蓝,和白色底结合起来,非常清爽。
3、douban.com的核心是书籍、音乐、电影和用户(小组),都采用缩略图,用户(小组)的缩略图小一些。前三者网上的图片一般都比较好看,也必须要大一些,后者因为可以上传,设计成更小的图,能使得图片显得好看。
4、除上面以外,douban对图片及其吝啬,几乎没有。连用户发评论,发帖都不可发图片。这样好处是非常明显的,一个能够使得用户专注在文字上,而图片部分都和网站核心相关,不会产生无关的东西。另外,使得网站访问速度非常快。
5、不管什么页面都是采用相同布局。布局采用上中下方式。最上面为导航;中间为2列方式,左边为页面核心内容,右面为辅助和相关功能和信息;下面是站务导航。所有导航同样没有一张图片。
6、 样式表使用上douban也匠心独运,链接的选都是深蓝反白,点上是橙色,删除是深红反白,书籍/音乐/电影使用深红反白,功能说明和站点书签 icon是绿色,推荐的星星是红色,剩下的就是永恒不变的黑色了。整个颜色围绕蓝色和红色色系以及绿色展开。这个和douban的logo能符合在一起, 非常的协调。
7、button使用的很少,不过我决定既然button都这么少了,还不如全部不用了,这样更好!
8、豆瓣的页面长度,每个页面非常短,一般2页,不超过3页。我一直认为太长的页面会使得用户失去耐心,而2-3页是最好的选择。之所以有这个长页面只不过是门户网站想多几个广告位置的做法,并不是每个网站都需要这样。
9、广告,豆瓣不同于其他网站,不提供花哨的广告位,目前只有google文字广告和“读书”,“读者”的文字广告,我想他以后也只会提供文字链接广告,如果提供了传统的图片、flash广告,整个站点都会变样。
10、 不使用弹出窗口,这点刚开始不太习惯,后来我研究觉得这个应该跟网站受众群有关系,大部分都是爱好读书、音乐、电影者,所以让用户尽量顺着线路走完还是比 较好的,因为这些东西我看没人都是跳着去欣赏的。因此我认为不习惯不弹出窗口的,可能也不太容易真正在douban上长久安家,注定也不是 douban的核心用户。
总体来说,douban.com非常精巧的应用了div+css,并且通过色系的运用,最大限度减少图片等等方式 既使得网站页面清新可人,而且可以最大限度的压缩了网页的大小,从而使得访问的效率得到了最大化。因为页面内几乎没有垃圾信息,从而使得google检索 起来都非常有效率,而每页的相关使得整站对检索机器人也是非常友好。ui布局上,整个网站统一布局,非常容易上手,不容易让用户迷失。豆瓣的ui哲学我想 跟开发者使用python也可能有关系,python是一种通过缩进来进行功能逻辑快的编排,加上python本身的精悍,从而使得python程序非常 的简约明了。从这个角度说豆瓣布局可以看作python程序的编排,豆瓣的理念也可以看作python的理念。
如果说要douban网站风 格属于什么流派,我想豆瓣应该是属于google的简约派!当然不能说是照搬,毕竟这不同于早期我们抄欧美黑乎乎的很商业的风格,近2年抄韩国大色块大图 大flash模版的那种做法。我觉得google的简约有四个关键点:简单(够用的功能,包括页面导航)、易用(简单就入手,交互和ui)、体贴(贴近用 户心理)、专注(基于业务本身),在此基础上加入自己的网站行业特性,是否意味着国内web2.0网站重构的可能的趋势呢?
