edwardtoday

Random thoughts, stories and ideas. Est. 2006.

OS和OS是不一样的

为了网络实验,在系里机房霸占了一台机器,稳定的ping,几乎始终在3%之内的CPU占用率(因为不用被别人time sharing),独立IP。唯一遗憾的就是校外ping不到这台主机,只能ssh回去,而那个ssh gateway速度确实不尽人意。实验用的工具,官方说兼容linux 2.4和2.6,刚发布的Ubuntu 11.10已经3.0了,为了避免潜在的折腾,还是用了10.04,LTS的优势就是网上的讨论帖会丰富许多,各种问题很快就能找到解决方案。 这台主机10多天来没重启没注销,一致勤勤恳恳地执行cron任务。相较之下,家里台机装的Windows,两周里蓝屏两次;平时用来写作业的Air没有死机过;Bold 9000主动重启了3次(就是用着用着突然间黑屏,LED亮红灯,然后灯灭,开始漫长的启动过程⋯⋯);装着大陆联通卡的Nokia N72已经一个多月没重启了;TP Link的小路由基本上每天我得手动reset两三次,不然ping google.

  • Pei Qing
    Pei Qing

Sweave果然是个利器

距离上一篇日志已经有三周了。现在各种课程的小组作业都已经开始,外加依旧繁琐的数据挖掘作业。我有些不理解,为什么数据挖掘作业要求手算的题目,维度那么高,记录条数那么多,非得我们计算器按到手抽筋才能摆平它。 算完之后,究竟对不对,计算器输入数字的时候,有没有手抖漏掉一个小数点或者误按了其他键,不得而知。好在有万能的Excel,写好公式统统帮我算好,结果一致我也就不看中间的值了。 至于用软件来k-means,我是真不想动用IBM那个PASW,虽然是个收费的,虽然看上去挺牛的,但是trial license的问题让我每隔15天得重新恢复虚拟机到没有授权的那个snapshot重来,何必呢。咱有GNU/R,kmeans还是挺方便的。第一次作业用Apriori的时候,也是R做的。R的文字结果都是限宽的,复制粘贴没啥问题;plot结果就得输出一下了,不管是eps还是pdf又或者是png之类的格式。但是第一次作业证明,前几次的输出都是不靠谱的,时不时会想出新增一个处理步骤,或者调整一下参数,难道再复制粘贴一遍么?! 牛人们又赐予了我Sweave。本以为用GUI写TeX的美好日子要过去了,结果发现TextMate有Sweave的bundle,还挺好用的。 这下不担心频繁修改R code了,随便怎么改,

  • Pei Qing
    Pei Qing

关于NAS的一些想法

想把存储的任务分离出来交给一个独立的NAS设备处理。方便管理,方便备份,方便从多个设备访问。 系统的选择就多种多样: Windows Home Server的优势是无敌的吸血雷,劣势是不免费。 Ubuntu Server挺好的 FreeNAS是后来看到的,原本是用UFS的,8.0开始主打ZFS了。于是引起了我对ZFS的关注。 关注了ZFS,就不得不关注Open Solaris了⋯⋯ 如果不用ZFS,Atom加上2G内存就够了。但是ZFS的亮点实在太多啊,尤其是Sun派人拿着锤子砸硬盘的demo,多么具有煽动性。ZFS的raidz、compression、dedup看起来都挺诱人的。 可是用ZFS的话,2G内存是不够滴,如果开了dedup,用64K的block,几T的存储就需要32G内存来放dedup table了。于是人们想到了把这个大表从内存转移到SSD上存放,这个时候不说SSD贵了,跟内存一比,那就是白菜价啊。反正现在手头有一块闲置的SSD(竟然把它闲置了!!),做缓存好歹也是个归宿⋯⋯ 等确定了方案再更新吧。To be continued.

  • Pei Qing
    Pei Qing

The Hero

有人说他是被新iPhone气死的?理由例如屏幕依然不增大到4寸,分辨率依然不变,仍旧没有多任务等等五花八门。 有人说他的离去将导致Apple走向灭亡。不过也有人说不管他走不走,Apple也就还能火两年了。 有人说他坚持的封闭解决方案不符合时代潮流。 不管怎样,一个人能得到广泛关注,就已经是一个成功了。被很多人夸很难,但被更多人骂是件简单的任务么?数数这世上有多少人会骂我?不管当面还是背后,能够持续多年被世人用各种语言赞美并谩骂着,是个多么了不起的成就。 想满足人的某种需求,有无数种方法,不会存在最复杂的某个方案,但总有最简单的一个。这种追求最简单解决方案的设计哲学使得Apple与众不同。Tim Cook在这次发布会上不止一次提到:“Only Apple can do this.”不管其他竞争对手是否有能力,现在的情况确实是“Only Apple has done all these.” 在我看来,这与许多人抨击的封闭不见得分得开。 如果不封闭,保障稳定性就是个不可能的任务。假如Lion的设计目标是兼容所有Windows 7能兼容的硬件,要么放出来一个天天四国的版本,

  • Pei Qing
    Pei Qing
Workflow: Use Homebrew for Missing Unix Tools in OS X

Workflow: Use Homebrew for Missing Unix Tools in OS X

虽然OS X希望将用户任务变得简单,不用面对命令行,但有时候难免会觉得特定任务用命令行比上网找个专门的GUI软件好多了。 比如上次找Sweave的资料时,想把一个路径下的文件都下载下来,包括一些.R, .tex, .Rnw, .Snw之类的一堆源文件。在56K Modem拨号的年代,我装了软件来下载内容离线浏览,现在这个带宽,早就抛弃了。 上面是用来伪装的引子,其实就是很久没用MacPorts,再经历各种系统升级、换机,ports需要重装了,就看到更简洁的Homebrew。 Install Homebrew 就一句话,命令行执行: /usr/bin/ruby -e

  • Pei Qing
    Pei Qing

一个矛盾

人到底是喜欢从众还是喜欢个性化? 人会因为别人说iPhone好用就去买iPhone,哪怕他们没用过;人会因为满大街都是iPhone,于是说服自己不买iPhone。 上面这句话把iPhone用很多街机带入都可以吧。 前天水木还有个帖,求A4L和C200选择。有人说A4L烂大街了,别买了;同样有人说A4L经受了群众的考验,值得出手。 无关话题:顺便bs一下LOL,当初是谁用类DOTA网游的名号起家的?现在改问为什么LOL要和DOTA一样了⋯⋯没玩过网游,不多评论游戏了,就吐槽一下这个广告⋯⋯

  • Pei Qing
    Pei Qing

Workflow: Use Carbon Copy Cloner to Backup

在renren上发了个状态问大家的意见,longbow说写写Time Machine。 从技术上看,Time Machine就是个封装过的rsync,在备份的时候,开Activity Monitor看一下,有个rsync进程很忙碌的。 Time Machine:Pros and Cons 最大的优点就是,插上一个移动硬盘,不管是USB的、Firewire的还是ThunderBolt的,系统会问你是不是把这个盘用于Time Mahine备份,给个肯定答复,一切就都备份了。没有比这更简单的了,Windows Backup哪怕到了Windows 7,都会问用户这样那样的问题,比如是不是做个系统镜像啊,除了用户文件和库里的文件,还有哪些要备份啊?不是说这样不可以,但是用户真的很可能无法区分系统和他自己的文件,无法区分哪些文件是在Library里面的,甚至根本没有意识到Windows 7多了个叫做Library的概念。如果用户这时候因为不知道而点错了,之后想恢复数据发现没有备份,用户会怪微软,而微软看起来确实没责任,选择是用户作出的。Time Machine没这个问题,除非用户多此一举把某个位置排除在备份之外,

  • Pei Qing
    Pei Qing

Workflow: Use Dropbox to Synchronize Among Devices

越来越多的人拥有超过一台电脑了,公司一台、家里一台、学校一台、实验室一台等等。现在手机可能也要加入数据共享的行列了,有些人可能需要自己的手机能随时访问公司某台电脑上的某个文件,或者希望手机拍了照片,能够自动同步到家里电脑的相册里面并且在另一处留个备份。 我是用Dropbox来做同步的。有其他选择,甚至自己装台linux机器,配好dyndns和rsync、samba、afp、ftp等服务也能达到目的,不过就是“强大,但是折腾”。 用一句话来概括就是把一个文件夹存到云上去,在多个设备间同步。 有PC、Mac、Linux,也有iPhone、iPad、Android、Blackberry版本。基本上一网打尽了。 只有一个文件夹,会不会太少了? 有这个想法,很可能没有用过hard link、symbolic link之类的功能,一句“ln -s source target”就可以把任何一个文件夹包含到dropbox目录里面。Windows用户可能会对Junction感兴趣,NTFS也是可以做链接的。

  • Pei Qing
    Pei Qing

What do you see from this picture?

昨天在论坛上看到这么一张图,时间是晚上,设备是air,标题是显示器灰阶测试。 我当时觉得灰阶测试用四个方块有啥好测的。不过看了回帖,我又用2311h看了看这张图,确实可以测一测⋯⋯ E、Z、O能看清,I很勉强。这是在恢复到工厂设置,然后调整到亮度40,对比度75的条件下。而平时我一般亮度20,对比度65,那么E也看不清了。 现在的显示技术,我感觉凡是细节表现出众的,都容易引起视疲劳,E-ink这种不容易疲劳的,对付上面这种图又束手无策。将来发展的空间很大啊。

  • Pei Qing
    Pei Qing

Apple Product Lineup

之前那篇关于ThunderBolt Cinema Display的文章已经隐含了一部分本文的意思了:看待一个产品,可以把它当做独立的个体,也可以将它放到市场上的其它产品当中去观察它。 一个显示器上做个网口,要用来接PC,那十有八九这网口废了,至少我没见到有文章介绍这种成功案例的;一个平板,除了耳机口就没有通用的扩展接口了,没有其他设备,仅靠它一个,那确实对很多应用没辙。 平时看到果粉和果黑的口水战已经见怪不怪了,各种网站上,尤其是cnbeta这个评论很丰富的站,每一篇关于apple的文章,不管内容如何,评论总是乱作一团。昨天水木有篇论战貌似上十大了,我看了几页,果然跟cnbeta一比,层次不同啊。cnbeta的评论,说mac不行,是拿Office和Office for Mac比较;水木上的高学历果黑,直接提出,cadence家的产品,只有win、linux、solaris版,没有mac版。看看,你们有多少人用cadence的产品的?我就没用过⋯⋯不过当初制板布线,确实是bootcamp windows做的。Mac下不是没有可能做到,

  • Pei Qing
    Pei Qing

The Power of Trim

这个新的SSD已经塞了不少东西了,不过Apple出厂配的SSD默认都是启用了Trim的。不像之前装上M4的老本,还得手动enable之。 从原来的机器上把整个用户目录外加所有程序迁移到了新机器上,复制了正在跟进的3个iTunesU课程,于是就这样了: 不过磁盘性能没什么下降: 刚买来的时候测试也差不多就这个数字了,唯一的区别在于,那时写入速度是瞬间稳定在230~240的,而今天则是从140起步,用了10秒钟左右才稳定到图中数值。我记得在PCEVA看到neeyuese测试M4的文章,花了不少工夫让M4的性能下降,结果跑测试没多久就恢复了。对于民用来说,这算法的性能我觉得已经可以接受了。

  • Pei Qing
    Pei Qing

ThunderBolt Cinema Display

上午在YouTube上看到ThunderBolt Cinema Display的一个视频,该MBP用家表示不理解为什么显示器后面需要一个Gigabit LAN口。他猜测是不是Apple将来会把这个显示器做成类似无盘终端那样的设备。 想象力很丰富啊。 Apple官网的宣传图是这样的: 注意图中用的的Air而不是Pro。Air没有以太网口,于是显示器上做一个,可能Apple觉得会有一部分消费者会为了一个网口买个显示器? 不过对于一个workflow完全固定的mac user,这个显示器确实挺方便的。Air可以随身带着,不用带AC电源,因为显示器提供了一个MagSafe口。所有的外设可以接到显示器上,如果那上面口不够,那么用ThunderBolt daisy chain好了。 把笔记本当台式机一样固定着用的人可能不理解为什么有人愿意多花不少钱买好几个电源,办公室一个,家里一个,另外常去的办公地点可能还得放一个,他们会问,随身带一个不就行了么?同理,这个显示器想做的就是不仅电源,外设也都别随身带,键盘鼠标接在显示器上,外置存储接在显示器上,有线的网络接在显示器上,随身带的电脑只要接上一个ThunderBolt线就可以了。这是目前cloud computing没成型的方案,等到不用依赖特定的设备来访问自己的文档时,连这个笔记本都不用带了。 技术是为了提高生产率而出现的,不是为了让我们多背上几个设备出门。虽然我不认为这个idea可以让一个很普通的显示器的价格飙升到999美刀,不过这确实比别的显示器多了点料。

  • Pei Qing
    Pei Qing

Knowledge is power

Knowledge is power.下面一句应该是France is bacon吧? 如果Francis当初不是翻译成弗朗西斯,而一不小心翻成了“法兰西斯”,在s和sh分不清楚的地区,中文也会有类似的有趣结局。 正题。现在每天可以接收到的信息量比十年前、二十年前大不止一个数量级,不过人类的大脑处理能力没什么明显的变化。各种input究竟有多少被我们处理并纳入了自身的数据库呢? 昨天的两门课上都提到了这个问题,input data太多,从中获取information已经很困难了,更别说将这些information进一步转化为knowledge。 每天面对Facebook、Twitter、Google Reader等等各种信息源不断生成的数据,怎样才能更好地获取信息,并转化成知识呢?这个问题十分困难。 前天看到有人做研究,声称rss令人们分散注意力,效率更低。我并不认同这个结论,但也并不否认rss本身效率并不怎么高。以我为例,朋友们的blog我不会每天打开浏览器刷一遍,而是订阅到google reader,放在一个文件夹里,以区分其他那些如果时间紧可能扫两眼就全部标为已读的源。这样的workflow实际上是提高了我follow大家blog的效率的,不过同样的方法想用到mailing list或者论坛讨论的订阅上,就很难行得通。blog站点可能一周一篇到几篇,

  • Pei Qing
    Pei Qing

退了一门课

当年在BAI Xiaoying和bigpizza手下学软件工程写PhoneMe的时候,还远远没有意识到那些知识到底有什么用处。不过工作中时不时遇到的低效率却再三凸显软件工程的重要性。于是我又选了个相关课程。结果退了…… 报告只收.doc文件,不收.docx我是可以理解的,不过明文说不收pdf,我觉得挺有趣的。国内的环境下,要求doc的成本并不高,每个人都有各种途径(尤其是教育网内部的各种文件服务器上)获取能够生成doc文件的各个版本office。不过在下载盗版软件都得想着警察叔叔找上门来的地方,要求doc……我知道有很多第三方软件也能生成doc,不过那兼容性除了纯文本内容能确保格式之外,还有什么能保留下来?我不止一次看到别人用openoffice等替代品打开一个.ppt,演示到一半发现有一大堆文字在显示范围之外。 一门CS的课程作业限定编程语言很正常,可至于连编辑器都要作限制么……jEdit又不是什么神一样的编辑器。 我个人认为,对编程环境的限制,应该越少越好。除非采集数据用的硬件只能在某个平台下工作,那么限制一下平台。或者采用机器评分而非人工的时候,受资源限制不能做跨平台,或者跨平台影响公平性(例如根据性能评价,而不同平台性能不同的时候),那么限制一下可执行文件的执行平台和输出就结了,至于人家用什么编辑器,什么编译器,什么调试器,这重要么? 另外一门课的project可以用C/

  • Pei Qing
    Pei Qing

QWERTY键盘

订阅了HowStuffWorks.com的podcast:The Stuff of Genius。昨天刚好看到“The QWERTY Keyboard”这一期。 好像人们对QWERTY键盘的看法都挺一致的,这种设计就是为了减慢人们打字速度而生的。 真的么? 就在作出评价前一分钟,同一个视频里很明确地指出当初顺序排列地键位会导致打字机很囧很纠结,于是才打乱了排列。QWERTY排列针对打字机来说,是提高了效率还是降低了效率? 即使放到现在看,键盘的机械设计已经变了,不存在同时按键会冲突的问题了(或者说很多键盘已经能做到这一点了),但是键位一直没大的变动,除了功能键偶尔换个地方呆着。可能会有人辩解说人们习惯了这种“低效”的键位,不过改变整个社会习惯的先例多了去了,当年的键位怎么就改了呢。 键位排列对于输入效率的作用,哪有那么简单。QWERTY排列和ABCDEF排列,哪种更高效,我就说不上来。 相关的研究也不少,除了QWERTY、DVORAK这两个比较容易见到产品的,AZERTY、COLEMAK、MALTRON还有ATOMIK之流。如果有一种键位能够明显而稳定地提升效率,起码在专业领域能取代QWERTY键盘的。 看podcast都得时时放着被忽悠,

  • Pei Qing
    Pei Qing

手机以及评测

我用的前一部手机是Nokia 3250,它是被摔坏的。 高考完了买的,寝室四个人,每个人都是上铺,床下面是书桌。所以一般手机摔下来,都是从1.7M左右的高度完成跳跃。运气好的话,在经过将近1M的飞行后,会与书桌接触,减速后再继续下坠。 大一的时候,它会分成手机主体、电池盖和电池三部分。大二的时候,顶盖会与手机主体分离。大三的时候,键盘也会分离开来。到了大四,哪怕放在口袋里,走路晃一晃,说不定就解体了。 然后我就买了现在用的这部Blackberry Bold 9000。当时感觉通话质量挺好的,不过在折磨它两年多之后,现在的通话质量已经赶上不少山寨机了。 我一直以为手机的通话质量是很重要的,不过这在国内的评测里似乎不是那么一回事。各大网站的手机评测关注的是配置、功能以及电池续航。好像没有人关注手机是不是会漏掉电话,是不是能清楚地接收以及发送双方的语音。刚才看了某网站对Android平台几个网络电话软件的横评,从头至尾都没有音质一说。我之所以skype上有钱但是一直没用掉,就是觉得它音质没有直播的清晰。文末评论有人提到缺少音质评价,立刻被challenge,说音质怎么评价,

  • Pei Qing
    Pei Qing

公平使用原则

各个运营商的无线、有线网络协议里会提到“公平使用原则”。 开通学校帐号的时候,ITS会给一个说明,也有这个“公平使用原则”。 说白了就是带宽有限,不要过度占用影响他人。否则服务提供方有权拒绝继续向你提供服务。 我就想不通了,这个资源分配的责任,咋就转嫁到用户头上了呢?这起码应该对用户透明,交给路由或者交换机来做吧。而且这样才能更好地保证多数用户的使用体验吧。指望用户老老实实限制自己使用的带宽,一来他们很可能做不到,二来也达不到最优的分配。即便用户知道总的带宽,比如1Gbps,他也不可能知道同一时刻,有多少其他用户在使用这个服务,那他究竟是限制自己的带宽到100M?10M?还是1M? 这明显是服务提供商才能做好的事情……

  • Pei Qing
    Pei Qing

你信或不信,我是觉得有道理了

Advice From An Old Programmer 这篇文章昨天经google reader被推送到kindle上,我看了觉得挺有道理。 http://learnpythonthehardway.org/book/advice.html 这里有个翻译 http://www.oschina.net/news/19009/advice-given-by-elder-programmers 重点在解决实际问题的思路而非语言 至于它怎么有道理,首先是作者提到的programming和programming language的关系。 不管是在学习还是在工作,程序员们太容易陷入到语言的细节中去,而忽视了解决问题的关键在idea而不是technique。同样做性能评价,究竟是给出一串运行时间还是一个O(…)的估计?好像在公司里我还从没见到过在文档里写后面一种的。 CSDN上昨天还有一篇文问你能写出多少C++关键字的,我实在想不出这除了能让人来做一部分本来由编译器做的检查之外,还有什么价值。很多行业的程序员,这辈子都不需要在自己的程序里写asm关键字,甚至都不会看到它,那就不熟悉C++了? 有些人说computer science

  • Pei Qing
    Pei Qing

时隔一年,又要开学了

回到上海一年,感谢大家的陪伴。尤其感谢Julian Xia,very nice~ 身份证预约了周五去办,所以各种需要身份证的手续就得延后了,比如手机上台、住处的宽带之类。 手机的话呢,上一篇提及的手机号码算是确定了,哪怕今后决定上台,还是沿用这个号码。大陆的同志们要sms的话,可以继续发到186号码去,因为我查详单发现我回短信扣费都是0.1一条,并没有贵诶。 网络使用上明显的区别就是在家里靠代理,这里不用了,所有我用得到的站点都可以访问。尤其是iTunes的服务器ping比大陆低多了,下起podcast和iTunesU的内容基本可以达到10M带宽(学校无线网)。 拥抱新生活。

  • Pei Qing
    Pei Qing

Contact Info Update

如果近期要联系我的话,除了email和各种页面的留言这种不保证立即回复的途径之外,最直接的就是手机了。 因为还没办到身份证,所以现在用的是预付费卡,我暂时不确定这是不是长久用下去的号码。 新的手机号是这样的: 如果你们知道我186XXXXXXXX的联通号(记为M),那么令Y = (M - 27702869) / 268,+852 Y就是香港的号码了。不过你都知道大陆号码了,直接发短信问就行了…… 如果知道我大学学号,2006XXXXXX那个(记为S),那么Y = (S - 63416483) / 28 也可以得到这个号码。 以前都是短信告知号码变更的,但是这次漫游的短信价格太高,HK号码发更贵,只好弄这么个变态的方法了。

  • Pei Qing
    Pei Qing

这就是所谓的又红又专么

以下共计44道问题,总分100分。每个问题只有YES和NO两个答案,YES得分,NO不得分。 不到40分,你是典型清华人,超过60分,你是极品清华人 一、 学习篇(共计20分) 选上过阎学通老师的课(1分)N 在一、二、三、四、五、六教都上过课(非习题课)(1分)N 某学期预选的课全部选上,没有掉一门(2分) Y 有过通宵复习经历,并且复习的那门课考了90分以上(2分)Y 考试周早晨图书馆排队排到过前三位(3分)N 考过100分(3分)N 有过考试时间冲突,被老师单独考试(4分)Y 四门政治课(思修、

  • Pei Qing
    Pei Qing

网络声誉

刚才在Google Reader里又看到一篇文章提到一个不算新的建议:在使用社交网络的时候,要时刻注意,你的老板可能也在看这些内容。 上个月的某期《第一财经周刊》也说到通过LinkedIn来求职的问题。 这类文章都会提示读者用搜索引擎搜一下自己的名字,看看有没有什么不希望他人看到的负面消息。 对于我来说,搜中文名和汉语拼音应该都没什么有信息量的东西。在网上,我就是edwardtoday,搜这个id的结果,基本上是我。如果是负面的内容,那就不是我,哈哈。我其实很纳闷会有其他人在论坛上用这个id,令我在一小部分网站上只能用edwardqing之类的id。不过无伤大雅了,看上去靠谱的,非垃圾信息的,那就是本人了。

  • Pei Qing
    Pei Qing

Back to Ubuntu

离开了工作岗位,就不再被束缚在Windows平台上了。 前阵子把老旧的MA701升级到了Lion。2GHz的Core2Duo加上3GB内存,勉强可以把Lion当作一个HTPC跑起来。其主要职责就两个,播放家里其他电脑上的视频(via Gigabit switch)和播放网上的视频(via 2Mbps小水管,10M的升级已经提上日程,电信在小区里发传单了)。这是个娱乐机。 主力的台机上装了Ubuntu虚拟机,放在SSD上,启动飞快。宿主系统Windows 7由于从盘较多,启动还得花个15秒左右,这Ubuntu直接6秒钟进入桌面,很是给力。 接下来的几天,用来配置学术用途的Ubuntu。编程环境配好,TeX编辑器就Emacs吧。以前曾经用过很短一段时间的auctex,后来懒得启动虚拟机(4年前的2.5寸机械盘实在是太慢了),就直接Mac下用TexShop了。那时候可真是一个字一个字敲出来的,完全不依赖自动补全。这时想想,花时间学习编辑器的使用,非常有必要。 至于Vim or Emacs的问题,我就是第一次进了vi之后出不来,有心理阴影了,于是学会退出vi之后,

  • Pei Qing
    Pei Qing
You've successfully subscribed to edwardtoday!