存档

  • 微博!!微博!!

    最近写了个工具,可以将Twitter中的Tweets同步到新浪微博、人人网状态和腾讯微博。其实我一直想做这样一件事情,多年前开发的Facefeed实现了用户内容的聚合,望江楼Digg实现了微博同步,但是斗转星移,Twitter在国内目前已经无法正常访问,饭否之辈也成了非主流,新浪微博现在一家独大,就连腾讯这个手里拿着6亿用户的巨人也暂时找不到一个有效的可以捍撼动新浪微博地位的方法。 不过除了Twitter以外,其他一些国内微博我自己使用的兴质到是不高,也一直没有想到一个好的可以将多个微博同步的方式。虽然国内有一些同步工具,但是1是觉得对帐户安全不放心2是觉得有些功能没有办法自定义,所以趁热打铁复习了一遍Python,操刀写了一个。新浪微博的Python SDK做得很好,文档齐全,代码写得很上档次(这一点让开发者觉得很赞!),人人网的SDK比较让我失望,居然不允许一般的App更新用户状态,需要访问此API要走一套流程,懒得去弄,最后用的是3g.renren.com的页面,使用类似HttpClient的方式更新的个人状态,腾讯微博就更令人蛋疼了,没有Python的SDK,无奈自己按照OAuth的标准搞了个简单的可以访问status/update接口的SDK。 然后就是各种调试,还随手写了个基于文件的k-v存储,Python真是个方便东西,然后就做好了,期间被几位同学抱怨过,其实之前我也考虑过,这样做同步有没有意义,后来觉得挺有意义的:1,我主要在Twitter上发东西,2,其他几个产品上的好友与Twitter上的交集很小。当然了,被我刷屏的同学都是几个地方跟我都是好友的同学,我只能抱怨一句,同学你上班的时候能不能别开着这么多微博! 期间@willchenhb说了一句话,让我记忆忧新,他说校内是他来看八卦的地方,这一点我觉得国内很多SNS都有这个特点,之间有人统计说Web2.0网站里的1-9-90原则,即内容是由1%的用户提供的,另外9%的是活跃用户,剩下的90%的都是来打酱油的。社交网络本来是一个以真实的人际关系为基础的,聚合了状态、相册、博客、线上游戏等功能的平台,但是目前在国内却成了八卦的天下、视频分享、奇文分享的领地,这不禁让人有些感慨。其实这一点开心网比人人网还严重,那里基本上就是个“链接营销”、视频分享、种种网页分享的大杂烩了,用户自己贡献的内容少之又少。

    980 次查看 | 没有评论
    2011年5月23日 | 归档于 Mobile, Web 2.0, 互联网, 博客
  • 第一次参加QClub的活动

    去年也报过一次名,但是最后有事情所以就没有去。这周一收到的邮件,QClub有一个技术沙龙的活动,定在周六,想来自己周六也没有别的什么事情,就报名参加了,看到题目也是我感兴趣的内容。其一是由百度的黄容芳讲的《Web数据交互的艺术》,其二是由豆瓣的刘洪清讲的《分布式数据库BeansDB在豆瓣的应用》。 黄的演讲,如果去掉艺术二字,个人认为还是一个很好的演讲,其讲了Web数据的几种不同实现,其对长连接的分析十分清晰明了,不过黄把“轮询”写成了“轮循”,虽然是个小错误,但我觉得“轮询”解释了此事件的本质,即间隔一段时间轮流(轮)询问(询),而轮循仅能表达轮流循环的意思;关于数据压缩,主要讲到了两种主要的实施手段,一是使用类似YUI Compressor的压缩器主动对需要传输的内容进行“精简”,我觉得称之为“精简”更明确一点。另外一种是使用GZIP来做压缩,对于大型网站为了提高用户体验,加快网页的加载时间,这是两个很好的方法。后面说到的跨浏览器通信,则是我完全没有接触过的内容,主要是想解决当客户在同一台机器上打开不同的浏览器,或是使用同一浏览器同时打开某一页面时,各页面之间内容同步的问题,主要的解决方案是Flash。后面说到了数据在客户端的存储,提到了ie的UserData,Firefox的localStorage以及Flash和HTM5,却没有提Google Gears,百度是不是跟Google有仇? 说到Flash,黄说Flash的覆盖率还不是很高,只有97%,百度能在乎剩下的3%,着实是挺令我惊讶,想中国的大多数网银和几年前的淘宝支付宝都不支持Firefox。不过我倒是很赞赏Apple的作法,宁愿支持html5也不愿意支持FLASH,不论苹果是否只是由商业利益做出的考虑,但是阻止flash来扰乱本来就已经很混乱的web标准,我是很赞同这样的作法的。 另外一位豆瓣的工程师刘讲的内容也吸引了很多人,我自己也被他的话题所吸引。说到分布式key-value数据库,自己早有耳闻,但是我一直不明白也一直不是很清楚这种类型的数据库如何被有效的利用在web2.0的应用中。豆瓣的作法是没有完全将MySQL替换掉,而是将那些结构化的数据依然保留在MySQL中,而将另外一些依据应用场景数量多,对一致性要求不是十分高、许多场景下是一次写入多次读出的数据存储在他们的分布式key-value数据库中。工业界追求第一位的并不是程序的理论上的最优性,而是在应用需求前提之下的性能和成本。key-value分布式数据库不是万能的,但是在一些场景之下,却可以解决应用的许多问题。豆瓣网的现行用户有3000多万,其每天处理的数据我觉得还算是一个不是非常巨大的场景,与twitter和facebook相比,其还要差一到两个层级。随着豆瓣的成长,希望能从他们那里得到更多的经验。 最近很忙,少有更新博客,可以在twitter上联系我。@bbiao

    1,830 次查看 | 3 条评论
    2010年4月10日 | 归档于 opensource, 云计算, 技术, 数据库, 校园, 生活
文章标签 ‘Web2.0’