Archive for 2006

豆瓣寻人 4: 算法与数据挖掘专家

星期一, 十二月 11th, 2006

豆瓣的(我们自认为算是精英的)算法团队每天都在碰到更有意思和更有挑战性的问题。无论你是这方面的新入门者、高校的研究小组,还是行业专家,我们随时都愿意和您取得联系。

基本职责:
1. 维护与改进豆瓣的推荐与数据挖掘算法
2. 为网站的改进和推广提供数据和分析支持
3. 跟踪互联网领域相关的算法进展和发展趋势

要求:
1. 热爱探索和钻研,相信算法能够改变人们的生活;
2. 本科或本科以上数学、物理、计算机或其他相关领域的训练;
3. 极佳的逻辑分析能力和学习能力,善于应对各种智力挑战;
4. 熟悉海量数据处理和挖掘的基本算法, 或有高性能科学计算的相关经验;
5. 能够使用C独立实现复杂的算法结构。

我们能提供:
1. 具有竞争力的薪水待遇,以及潜在的收益机会;
2. 具有挑战性的项目,包括处理千万条以上真实行业数据的实战机会;以及快速成长的空间;
3. 宽松、自由的工作环境。

有兴趣请发email至team@douban.com 。

(欢迎转载,谢谢)

长尾年代: 《长尾理论》的评论

星期日, 十二月 3rd, 2006

1897年夏天,意大利经济学家帕累托(Pareto)在研究英国社会分配的时候发现,百分之二十的人控制着百分之八十的财富。后人在现实世界里形形色色的分布里也看到了类似“少多众寡”的现象:大段文字里单词出现的频率、都市城镇的人口、沙粒的大小,甚至林火烧过的面积。比如,把全世界每个人拥有的财富从大到小排起来,一边是一个纤细但高耸入云的头,另一边是漫长的一望无际,低矮的让人绝望的尾。这样的分布在经济学里被灌名为“帕累托分布”,只是一直不为大众所知。但是有一个简单的版本一直在商业世界里传诵, 就是今天的“80/20原则”。

1982年春天,托夫勒的《第三次浪潮》在中国登岸。我们刚开始憧憬大工业生产的时候,托夫勒就不识时务地预言它的灭亡。“不再有大规模生产。不再有大众消费。不再有大众娱乐”。取而代之的是个性化到每个人的生产、创造和消费。为什么要有重样的产品?难道生产和消费不能是一件事吗?遗憾的是,大家激动过后,发现还没有见识过真正大众消费的时候就琢磨它的消亡实在需要太多的想像力。二十年后大众娱乐终于到来的时候,托夫勒早已经被多数人抛在了脑后。

到了2004年的秋天,终于有人把这两件事扯在了一起。美国《联线》(Wired)杂志发表了总编克里斯・安德森(Chris Anderson)的文章:长尾。副标题是“别老掂着从榜顶的几个巨无霸里多榨几百万出来。娱乐的未来在码流低浅的那头无数个细微市场那儿”。“低浅的那头”,其实就是帕累托分布的尾巴;“无数个细微市场”,其实也就是托夫勒的全民个性化消费。安德森的神来之笔,是在极其正确的时间,在极其正确的媒体上,用一个简单响亮的词向大众描绘了互联网下面高涨涌动之中的暗流。安德森一发不可收拾,开始在Long Tail Blog上公开编撰书稿。两年后,《长尾理论》(The Long Tail)问世了。

沿袭记者擅长的悬疑开局,安德森用真实发生的几件事向我们直接勾画出了长尾现象:一本六年无人过问的冷门书突然窜上《纽约时报》的排行榜,因为有人在评论类似话题的新书的时候提到了它;在线音乐店Rhapsody里下载排行十万名以后的那些歌,在任何一家最最专业的唱片店都找不到,每月下载次数只有几次、几十次,加起来却占了所有下载次数的15%;在线DVD租赁店Netflix销量占末尾21%的碟片在任何一家线下碟店都找不到。这些“多出来”的冷僻产品每样都卖得可怜,但因为品种数目庞大,加起来却能带来不小的销售。这就是长尾了。

如果你想在一刻种内比较精准地把握可能是下一个流行的谈资,读到这里也就差不多够了。对更好奇或者多疑的读者来说,有些个问题还是值得探究的。比方说,为什么线下商店没有长尾?长尾和以前说的80/20原则有什么关系? 那些长尾产品既然不畅销,会不会都是垃圾? 长尾对畅销排行榜有什么影响?长尾的泛滥会导致个人中心主义吗?还有些更功利的问题:长尾带来什么样的机会?怎样去利用它?这本书剩下来95%的篇幅里,用简单直观的方式给出了这些问题的答案。总的来说,长尾无处不在,无时不在。只是有了网络以后,各个环节的成本都大大降低,长尾的东西才有了广泛产生、传播和获取的可能。

和《引爆流行》、《世界是平的》一样,作者倾向于在讲清楚核心命题以后,开始多角度、多行业反复引申和描述。要是你和我一样对渲染容易感到困倦,看到第六章的时候我建议你提起神来。承认长尾里鱼目混杂以后,安德森用“过滤器”的概念来解释为什么直到现在长尾才开始重要起来。长尾里选择过多,所以要为每个人挑出合适的东西,需要更强大的过滤器。编辑、星探、营销者、广告是传统的“事前过滤器”。博客、评论、推荐、草根意见是“事后过滤器”,只有这些能应对长尾的低信噪比和极端个人化的兴趣取向。网络发展到今天,终于有了搜索、推荐这些强大的信息技术,可以为单个消费者提供有效的过滤。这是长尾现象和Web 2.0产生在同样年代的原因。

长尾理论》生动、易读、及时,面面俱到,这些决定了这会是一本对很多行业影响深远的书。期望更深入理解和指引的读者可能会觉得不过瘾。不过长尾是此时此刻正在发生的事情,有机会参与其中,比起任何单纯的脑力享受来,我认为是更加幸运的。

豆瓣“我上”

星期四, 十一月 9th, 2006

没错,就是“我上”,豆瓣的“我上”,关于blog收藏与发现的服务。

不知有多少人像我一样,订阅了几十个感兴趣的blog,每天却只阅读了不到十分之一。面对日益膨胀的blog信息,你是不是有大海捞针的感觉?

不少豆友在注册的同时提供了个人blog地址,首先我们要感谢这一慷慨的无私奉献,同时这也提醒我们,有这么多有趣的东西,为什么不拿来和大家分享呢?秉承了豆瓣的“我读”、“我看”、“我听”、“我去”的一贯宗旨,“我上”希望能帮助豆友们梳理和过滤信息,体验分享和发现的乐趣。目前测试版本的”我上“能够满足豆友们两方面的需求:
1.收藏和评价自己喜欢的blog
2.从浩如烟海的数据中发现潜在的你可能感兴趣的blog地址
上线最初的一段时间,“我上”看起来可能还比较简陋,使用可能还不是那么顺畅,不过请相信豆瓣,改善用户体验是我们始终如一的追求;同时请相信你自己,你收藏和评价的blog越多,豆瓣给你的推荐就越丰富、有趣和准确。

“我上”不是RSS阅读器,“我上”也不是网摘,我们希望有一天,“我上”能够成为豆友们在blog汪洋大海中航行的罗盘。

遥想豆瓣当年,各位blogger为豆瓣的成长和传播摇旗呐喊,让我们真真切切的体会到了”Word-of-Mouth”的力量。“我上”也是对各位blogger的一种回馈,希望我们的服务能够对大家有所帮助。同时,感谢各位豆友长期以来对豆瓣的支持,并欢迎大家对“我上”多多测试。

2006.11.8中午访问中断的情况说明

星期三, 十一月 8th, 2006

今天(2006.11.8)中午12:30起,豆瓣服务器的一块硬盘发生了故障,豆瓣团队正在修复中,一小时左右豆瓣就会重回大家的怀抱。

豆瓣的用户数据有三重备份,请诸位豆友放心。

这次意外给大家造成的不便,豆瓣团队深感抱歉。

16:15 Update :豆瓣归来,Hoooooooooooooray~

:如有豆友发觉自己的数据有丢失或者异常,请来站务论坛告知我们,谢谢。

18:33 Update :由于11月5日下午18:48到次日凌晨一点的数据没有恢复完全,现在需要停止豆瓣的访问,线下进行恢复。

21:30 Update :终于完全恢复了。现在我们能做到这种硬件问题发生的时候不丢数据。过段时间我们会保证不中断服务。这次非常抱歉。

2006.8.19晚中断预告

星期六, 八月 19th, 2006

豆瓣今晚将切换机房,并部署新的服务器,今晚将有几次间歇性的服务中断,每次应该不超过30分钟。另外,今天明天豆瓣服务有可能会不太稳定。我们估计情况不会特别严重。

这次扩容是为增长中的访问量和新的功能做准备。对给大家造成的不便,我们再次深感歉意。

豆瓣寻人 3

星期三, 八月 16th, 2006

豆瓣终于开始在技术团队之外寻找团队成员了。有以下工作经验的豆瓣粉丝(已经是或者将要是的)请注意:

1. 行政、人力资源主管兼办公室主任 (全职, 北京)

主要工作:看管十来个大小男孩女孩 (一部分在下图中有陈列)。

要求: 有快速增长的企业里综合行政工作的经验;有管理三资企业员工薪金和福利的经验; 热情、主动、反应敏捷。

有财务经验者优先。熟悉相关资质申办流程者优先。

这是一个以日常事物为主的动手(含动嘴和跑腿)工作,但我们欢迎有管理经验或对发展空间有期望的高手加入。

2. 旅行、电影条目编辑各一位 (全职或长期兼职)

主要工作:协助豆瓣用户建立和维护网上最好的电影、旅行景点的中英文条目大全。

要求:热爱旅行或电影;熟悉中国和世界地理或电影;有基本的程序或批量文字处理能力;有语言天分;耐心、细致、有条理,有组织能力。

有相关产品管理或产品营销经验者优先。

3. 豆瓣音乐领队 (全职, 北京)

主要工作:挖掘和争取各种内部和外部资源,使豆瓣用户能够听到最好的音乐。

要求: 热爱音乐;熟悉音乐的制作、发行和网上传播;高度发达的分析和逻辑大脑;强有力的沟通能力。

曾经担任过严格、正式、真正意义上的产品经理者优先。有产品营销经验者优先。

请email至 team@douban.com。欢迎并感谢转载!

[ 2006.11.30 更新 ] 行政主管和音乐领队已经找到。谢谢大家。

因为豆瓣的人手严重不足,而且之前没有专人负责人力资源,收到的近千份回复没有及时回复,在这里我深表歉意。我们正在补救,以后也会做得更好。这里既然是豆瓣,很多回复是绝对的阅读享受,也让我们无比感动。

电影和旅行编辑仍在寻找中,这也是回复最多的职位。我们首先需要的是一名全职成员,然后由他/她协调兼职工作。我们会尽快考虑,感谢大家的耐心。

2006.8.3晚中断预告

星期四, 八月 3rd, 2006

为准备功能更新,今晚豆瓣将有几次间歇性的服务中断,每次应该不超过20分钟。对可能给大家造成的不便,我们深感歉意。

brant、xyb、胖子(正式)加入豆瓣团队

星期三, 六月 21st, 2006

对豆瓣的老用户来说,brant应该无需介绍。他一直是豆瓣社区里的活跃成员,今年春节开始为豆瓣兼职工作。一个月之前,brant单枪匹马从武汉杀到北京,准备投身互联网事业。豆瓣近水楼台成功拦截,Brant欣然成为团队正式的成员。他将继续负责社区和服务,也会协助开发团队规划新的内容。

xyb, 豆瓣第70号用户,UNIX、Python、邮件、高性能系统的高手,本周起加入了豆瓣的开发团队。xyb之前率先解答了我们的长尾数学问题。他还一直是中文维基百科的管理员。xyb正在汇总整个地球的地图数据,准备豆瓣新服务的推出。

历经整个春天的筹备,胖子也如约加入了豆瓣。胖子是豆瓣的“第一周用户“(37号)。从他读过的书和写出的书评里,你断然不能看出他是一个算法和优化专家。几年前一个寒冷的夜晚,我曾经拉着他紧随送奶的冷藏车开过上海的大街小巷,记录到每一个便利店的距离和时间, 直到天亮。然后胖子用了几个月时间做出一个庞大的数学模型来计算中转仓库的最佳数量和位置。目的是为了用更低的成本把更新鲜的牛奶送到早班的人群手中。在豆瓣,同样是为了更好的服务,胖子面临许多更有挑战性的问题。为此他和整个团队都激动不已。

欢迎brant、xyb、胖子! 春困已过,整个夏天豆瓣会不断有好的消息传出。

(豆瓣寻人1, 2仍在继续)

贴手机照不说话

星期六, 六月 3rd, 2006

猫扑也来抄豆瓣?

星期五, 五月 5th, 2006

还是”借鉴”? :) 无语。

http://look.itv.mop.com/

有些评论是从豆瓣转过去的, 请猫扑的用户和工作人员注意豆瓣每篇评论右上角的版权声明。