愚人节已经过去
星期五, 四月 7th, 2006这位“消息人士”睡过头了吧:
消息人士向记者透露,目前豆瓣网已经被千橡互动收购。该人士称,收购金额大概是百万人民币的级别,主要以换股的方式进行。…..
拜托,造新闻也请专业一点,把“金额”往上抬两个数量级好不好。:)
今天以后,此类流言豆瓣概不评论。
这位“消息人士”睡过头了吧:
消息人士向记者透露,目前豆瓣网已经被千橡互动收购。该人士称,收购金额大概是百万人民币的级别,主要以换股的方式进行。…..
拜托,造新闻也请专业一点,把“金额”往上抬两个数量级好不好。:)
今天以后,此类流言豆瓣概不评论。
现在人数在50人以下的小组大约占了全部4000+个小组的90%,那么按照豆瓣的分布,这后90%的小组全部加起来一共有多少的出现几率?(在全部六个位置中)即我们有多大机会在“15分钟名组”看到一个不到50人的小组?10%?5%?1%?还是更少?
提的比较清楚的是后一个问题。重述在此:
在”15分钟名组”里看到(至少)一个不到50人的小组的几率有多少?
这其实是一个统计的问题。可以去做一个模拟,不过我想看看有没有更聪明的答案. 所以在这里公开征解。
先看看”15分钟名组”是怎么来的。豆瓣的FAQ说:
[6个"15分钟名组"]从所有小组里随机挑选。每15分钟更新一次。这个列表是为了打破以前“最受欢迎的6个小组”造成的贫富分化日巨问题。
但是不是所有小组都机会均等(这样的话,选中的小组基本上会只有一个成员)。小组成员越多,选中的机会越多。挑选是由豆瓣系统自动用随机数进行。所有小组按人气排队以后,选中的几率遵从一个长尾分布。所以即使只有一个人的小组也可能上榜,但极有可能是一个月里某一天的凌晨3点52分。
这个“长尾分布”, 豆瓣的程序里是用Pareto分布计算的。学统计的,或者看过Linked这本书的人应该知道。定义在这里:
http://www.answers.com/topic/pareto-distribution
豆瓣现在用的k=0.5 (就是Pareto Index, 也叫alpha). 排序(x)从1开始。此刻现在共有4154个小组,第421个小组以后成员数就小于50了.
第一个模拟出来的正确答案的,我请喝酒。第一个给出解析正解(就是用公式算出来)的,我送超女之一的亲笔签名T-Shirt (空白T-Shirt自备)。我还不知道正确答案,所以可能需要两个以上正解。
没准这个问题有一天会出现在研究生入学考试题里。:)
欢迎转发。
2005年3月6日下午,我弱弱地给中国Python用户组的邮件列表发了一封email。题目是”用python开发的网站开始公测”:
欢迎到https://douban.com使用豆瓣的读书者网络和书价比较。
豆瓣全部使用python开发。网站后台的搜索引擎基于Twisted, GUI基于Quixote. 还用到了cElementTree, MySQLdb和 PIL. 除了这些豆瓣基本是从头开发(一个人四、五个月)完成。
如果你有爱读书或爱写书评的朋友,也欢迎推荐豆瓣给他们。最好的方式是通过豆瓣的邀请功能。
谢谢!
当时我已经抓着几个朋友内部测试了几天。总算,世界上别的人知道了有豆瓣这么个网站。虽然是公“测”,按照“永远beta”的2.0原则,这就算是面世了。回想起来,这个程序员的邮件列表其实不是最好的PR渠道。但我有些私心。当时bugs还很多,做程序的应该比较理解,不会扭头就走,报告起来也说的清楚。
我觉得所有网站第一次上线的时候,开发者都会满头大汗盯着屏幕不断刷屏。我呢,一直刷到天亮。不过算上我别的几个朋友,当天也就来了五六个人。但晚上无聊的头和anuxs就写了书评。然后就有了回应。我也第一次知道,世界上有杜尚访谈录和辛丰年音乐笔记这些个书,因为这两个人看过。豆瓣,这个在脑子里憋了半年的东西,竟然有人用了,而且能对人有用! 我猜想初为人父者听到自己的孩子第一声嚎哭的时候,感受应该有相似的地方吧。
今天,一年之后,十一万形形色色的人在豆瓣上有了自己的空间和自己的圈子。他们共通的地方是对书、电影、音乐的热爱。每个月还有百多万潜水的访问者, 通过豆瓣发现他们以前不知道的东西。更重要的是,今天的豆瓣有了自己的生命,循着自己的轨迹生长。我能够做的,是寻找更多的看护人和建设者, 给这个生命更大的空间和养分。
感谢一年多来无数热爱豆瓣的人给豆瓣团队的支持。现在是热身后的稍息,我们才刚开始。
豆瓣在寻找另外一名技术角色的团队伙伴。专长在Web应用程序的开发。
针对眼下这个位置, 有下面经验的人更加理想:
1. 有Web应用实现的专长和经验,参与过面对个人的网站构架设计。有高速增长的网站运作经验者优先。
2. 熟悉Python/Ruby/PHP/Perl/Javascipt/C/Java中的三种或以上。Python和Ruby优先。
3. 熟悉数据库设计,有基本的DBA能力。有Mysql经验者优先。
下面是豆瓣技术团队的一般性描述。抱歉重复一下前一篇启示的内容。原则是这样:我们倾向于组建一个小的精英技术团队。
1. 你是天才程序员, 而且以此为乐。你有多个大型项目的独立设计经历,但仍然乐此不疲地写代码。如果你不能确定自己是否天生的程序员,或者认为你的下一个理想工作是高级开发经理或者不用写code的高级架构师,豆瓣暂时对你不合适。:)
2. 你有能力直接跟踪和学习最新的软件技术。如果你没有在open source项目的英文邮件列表里和开发者直接沟通, 提供bug report或者贡献patch的经历,豆瓣暂时对你不合适。:)
3. 你需要具有自我管理能力、创新情结和创业心态。
4. 你以前和同事或伙伴的沟通和合作关系愉快多于郁闷。
豆瓣可以提供:
1. 真正位于创新前沿的创业经历。比如,你在豆瓣的工作可能对数个行业的发展产生实质性的影响。
2. 平等,独立的小团队工作伙伴关系和宽松、灵活的工作环境。比如,你可以在家或者远程工作。
3. 有竞争力的待遇和潜在的长期收益机会。比如,每位全职团队成员都会拥有一部分豆瓣的期权。
有兴趣或者问题请email至 team(a)douban.com。你可以用任何方式介绍自己,比如,附上过去引以为豪的一个创造。
欢迎转载。谢谢!
– 阿北 (豆瓣01号程序员)
豆瓣的新服务器将在今夜投入使用。服务器切换的时候(北京时间夜间2点到早晨之间)可能会有数小时的服务间断。对可能造成的不便之处我们表示歉意。
因为新的服务器在北京电信(现在的服务器在上海电信)的机房,www.douban.com的IP地址会有改变。你有可能需要重起浏览器得到新的地址。
欢迎报告(明天早晨起)访问豆瓣速度的变化。
[5am 更新] 切换成功,服务恢复了。
豆瓣在寻找一名技术角色的团队伙伴。专长在Web界面的设计和前端程序实现。
下面是豆瓣技术团队的一般性描述。原则是这样:我们倾向于组建一个小的精英技术团队。
1. 你是天才程序员, 而且以此为乐。你有多个大型项目的独立设计经历,但仍然乐此不疲地写代码。如果你不能确定自己是否天生的程序员,或者认为你的下一个理想工作是高级开发经理或者不用写code的高级架构师,豆瓣暂时对你不合适。:)
2. 你有能力直接跟踪和学习最新的软件技术。如果你没有在open source项目的英文邮件列表里和开发者直接沟通, 提供bug report或者贡献patch的经历,豆瓣暂时对你不合适。:)
3. 你需要具有自我管理能力、创新情结和创业心态。
4. 你以前和同事或伙伴的沟通和合作关系愉快多于郁闷。
针对眼下这个位置, 有下面经验的人更加理想:
1. 有浏览器界面设计的专长和经验,有可用性设计的和交互设计的基本常识。不要求有美工设计能力。
2. 在javascript, css, ajax, actionscript方面有深入的研究和多个项目的实际经验。比如,有能力从头设计一个ajax基础库, 或者手工书写flash代码。
豆瓣可以提供:
1. 真正位于创新前沿的创业经历。比如,你在豆瓣的工作可能对数个行业的发展产生实质性的影响。
2. 平等,独立的小团队工作伙伴关系和宽松、灵活的工作环境。比如,你可以在家或者远程工作。
3. 有竞争力的待遇,以及潜在的长期收益机会。比如,每位全职团队成员都会拥有一部分豆瓣的期权。
有兴趣或者问题请email至 team(a)douban.com。你可以用任何方式介绍自己,比如,附上过去引以为豪的一个创造。
欢迎转载。谢谢!
– 阿北 (豆瓣01号程序员)
豆瓣需要在两天之内购买一台1U的服务器。这个是配制要求:
cpu: AMD athlon X2 4200+ 双核。(更理想的是AMD Opteron 170 Dual-Core , 但是好像中国大陆现在没货)
主版: Tyan Tomcat K8E S2865G2NR
内存: 金士顿 DDR-400 1G, 4条 (非ECC)
硬盘: WD 73G SATA-II Raptor 73G, 10000rpm, 2块
无操作系统
1U机箱、电源、风扇、散热设计:由供应商自己提供方案。只要2个硬盘空间,不要求热插拔。要求有能够解决类似功率cpu散热问题的实际成功案例。要求稳定性第一位。如果价格合适,也可以考虑Tyan GT20 B2865平台(在北京找不到)
对供应商的要求: 我们希望能找到可以持续合作的准DIY机架服务器供应商,最好在北京。不要求规模大,但希望能跟踪最新的配件技术持续地提供优化、经济、专业的准DIY服务器方案。我们自己有组装维护的能力,所以希望您能贡献的价值是经济的货源和机箱散热部件方面的充沛经验。
请将方案和报价email给webmaster (a) douban.com. 也欢迎推荐、告知你知道的好的供应商。谢谢。
[2006.1.23 更新] 谢谢大家。服务器已经装好, 现在正在安装系统。最后走的路数是这样:找一个集成商采购机箱电源以外的部件,然后直接找机箱厂家寻求散热方案。谢谢吕欣欣的引见和千际唐华的帮助。