Archive for 三月, 2006

Hongqn加入豆瓣

星期三, 三月 8th, 2006

hongqn, 豆瓣第2211号用户,Gentoo Linux、Python、动漫和房屋装修高级fans,今天开始正式加入豆瓣团队。Hongqn去年就帮助豆瓣解决过技术问题,到现在还只有豆瓣团队的人知道。

Hongqn是豆瓣程序员002号。我”念天地之悠悠“的日子终于划上了句号。想试试极限编程, 也不再用两手互博了。

他目前的工作主要在后台, 比如要是大家看到书价比较的价格滞后有所改善,那就会是他的功劳。

欢迎Hongqn!

(豆瓣寻人1, 2仍在继续)

长尾数学问题悬赏

星期三, 三月 8th, 2006

今天豆瓣小组里说梦痴·的的慢提了这样一个问题:

现在人数在50人以下的小组大约占了全部4000+个小组的90%,那么按照豆瓣的分布,这后90%的小组全部加起来一共有多少的出现几率?(在全部六个位置中)即我们有多大机会在“15分钟名组”看到一个不到50人的小组?10%?5%?1%?还是更少?

提的比较清楚的是后一个问题。重述在此:

在”15分钟名组”里看到(至少)一个不到50人的小组的几率有多少?

这其实是一个统计的问题。可以去做一个模拟,不过我想看看有没有更聪明的答案. 所以在这里公开征解。

先看看”15分钟名组”是怎么来的。豆瓣的FAQ说:

[6个"15分钟名组"]从所有小组里随机挑选。每15分钟更新一次。这个列表是为了打破以前“最受欢迎的6个小组”造成的贫富分化日巨问题。

但是不是所有小组都机会均等(这样的话,选中的小组基本上会只有一个成员)。小组成员越多,选中的机会越多。挑选是由豆瓣系统自动用随机数进行。所有小组按人气排队以后,选中的几率遵从一个长尾分布。所以即使只有一个人的小组也可能上榜,但极有可能是一个月里某一天的凌晨3点52分。

这个“长尾分布”, 豆瓣的程序里是用Pareto分布计算的。学统计的,或者看过Linked这本书的人应该知道。定义在这里:

http://www.answers.com/topic/pareto-distribution

豆瓣现在用的k=0.5 (就是Pareto Index, 也叫alpha). 排序(x)从1开始。此刻现在共有4154个小组,第421个小组以后成员数就小于50了.

第一个模拟出来的正确答案的,我请喝酒。第一个给出解析正解(就是用公式算出来)的,我送超女之一的亲笔签名T-Shirt (空白T-Shirt自备)。我还不知道正确答案,所以可能需要两个以上正解。

没准这个问题有一天会出现在研究生入学考试题里。:)

欢迎转发。

豆瓣一年

星期一, 三月 6th, 2006

2005年3月6日下午,我弱弱地给中国Python用户组的邮件列表发了一封email。题目是”用python开发的网站开始公测”:

欢迎到https://douban.com使用豆瓣的读书者网络和书价比较。

豆瓣全部使用python开发。网站后台的搜索引擎基于Twisted, GUI基于Quixote. 还用到了cElementTree, MySQLdb和 PIL. 除了这些豆瓣基本是从头开发(一个人四、五个月)完成。

如果你有爱读书或爱写书评的朋友,也欢迎推荐豆瓣给他们。最好的方式是通过豆瓣的邀请功能。

谢谢!

当时我已经抓着几个朋友内部测试了几天。总算,世界上别的人知道了有豆瓣这么个网站。虽然是公“测”,按照“永远beta”的2.0原则,这就算是面世了。回想起来,这个程序员的邮件列表其实不是最好的PR渠道。但我有些私心。当时bugs还很多,做程序的应该比较理解,不会扭头就走,报告起来也说的清楚。

我觉得所有网站第一次上线的时候,开发者都会满头大汗盯着屏幕不断刷屏。我呢,一直刷到天亮。不过算上我别的几个朋友,当天也就来了五六个人。但晚上无聊的头anuxs就写了书评。然后就有了回应。我也第一次知道,世界上有杜尚访谈录辛丰年音乐笔记这些个书,因为这两个人看过。豆瓣,这个在脑子里憋了半年的东西,竟然有人用了,而且能对人有用! 我猜想初为人父者听到自己的孩子第一声嚎哭的时候,感受应该有相似的地方吧。

今天,一年之后,十一万形形色色的人在豆瓣上有了自己的空间和自己的圈子。他们共通的地方是对书、电影、音乐的热爱。每个月还有百多万潜水的访问者, 通过豆瓣发现他们以前不知道的东西。更重要的是,今天的豆瓣有了自己的生命,循着自己的轨迹生长。我能够做的,是寻找更多的看护人建设者, 给这个生命更大的空间和养分。

感谢一年多来无数热爱豆瓣的人给豆瓣团队的支持。现在是热身后的稍息,我们才刚开始。

豆瓣寻人 2

星期四, 三月 2nd, 2006

豆瓣在寻找另外一名技术角色的团队伙伴。专长在Web应用程序的开发。

针对眼下这个位置, 有下面经验的人更加理想:

1. 有Web应用实现的专长和经验,参与过面对个人的网站构架设计。有高速增长的网站运作经验者优先。
2. 熟悉Python/Ruby/PHP/Perl/Javascipt/C/Java中的三种或以上。Python和Ruby优先。
3. 熟悉数据库设计,有基本的DBA能力。有Mysql经验者优先。

下面是豆瓣技术团队的一般性描述。抱歉重复一下前一篇启示的内容。原则是这样:我们倾向于组建一个小的精英技术团队。

1. 你是天才程序员, 而且以此为乐。你有多个大型项目的独立设计经历,但仍然乐此不疲地写代码。如果你不能确定自己是否天生的程序员,或者认为你的下一个理想工作是高级开发经理或者不用写code的高级架构师,豆瓣暂时对你不合适。:)

2. 你有能力直接跟踪和学习最新的软件技术。如果你没有在open source项目的英文邮件列表里和开发者直接沟通, 提供bug report或者贡献patch的经历,豆瓣暂时对你不合适。:)

3. 你需要具有自我管理能力、创新情结和创业心态。

4. 你以前和同事或伙伴的沟通和合作关系愉快多于郁闷。

豆瓣可以提供:

1. 真正位于创新前沿的创业经历。比如,你在豆瓣的工作可能对数个行业的发展产生实质性的影响。
2. 平等,独立的小团队工作伙伴关系和宽松、灵活的工作环境。比如,你可以在家或者远程工作。
3. 有竞争力的待遇和潜在的长期收益机会。比如,每位全职团队成员都会拥有一部分豆瓣的期权。

有兴趣或者问题请email至 team(a)douban.com。你可以用任何方式介绍自己,比如,附上过去引以为豪的一个创造。

欢迎转载。谢谢!

– 阿北 (豆瓣01号程序员)