阅读与审稿

阅读与审稿在很大程度上是可以互相借鉴的,这其中包括迅速提炼文章中心,寻找论点,检查论点可靠性等等。所以读书多了看论文也很快,审文章也比较轻松。当然审文章还有些自己的套路,比如之前提过的,审不出问题就举几篇近期相同研究要求作者增加对比实验等等。但是审文章和读书有个很大的不同,那就是阅读的目的。

在科研分工越来越扁平化的时代,大多数研究工作是增量式的。这其中包括:
1)大多数文章的研究问题是已经良定义的。甚至有着标准的数据集和所谓state-of-the-art的比较方法,只要按照一样的规则进行对比,就可以写成八股文样式的作品;2)大多数文章的方法是对前人工作的改进。例如在我研究生的研究领域,大量文章不过是改进某些经典算子。其实严格的讲,都无人确认算子是否真正被改进了,或者只是工作流程中别的部分被强行优化了。
所以,审稿碰到这样的工作时——很大概率会碰到,而且我相信大多数人希望碰到,因为对自己熟悉的领域,一般10到15分钟就可以读完一篇文章——首要目的并不是汲取什么优点,而是迅速找到问题,给出修改或者拒绝意见。这就意味着,这种带着目的的阅读,是去寻找缺点的,潜意识会利用类似速读的技巧忽略别的东西。

如果把这种阅读“技巧”用在读书上,那几乎每本书都有问题。的确习惯了审稿的思维后,读书很容易找出问题,我前阵子发现自己的豆瓣书评可以罗列书中很多缺点。

最近突然意识到,我自己花钱买书并不是要帮作者找问题的。所以读书应当抱着寻宝的心态,寻找文章中有益的内容,以长期功利的目的阅读。这样,即使再烂的书也能找到写好东西,也不太会抱怨看被书商营销给骗了。

两种研究方式

读研究生可能碰到各种导师,但可以分成两类。一种会集合各方资源整出文章,也许一进实验室就会接手前人的工作,做完了有专人负责改文章,别人还在听如何做研究的讲座时他已经投了文章在修改了。另一种会让学生学基础课程看经典论文查新文献写报告复现实验设计新方法写论文投稿,可能别人开始找工作了他终于拿到返修意见开始补实验了。

这两种模式的区别在于前者的目标是研究成果,后者的目标是个人能力。一种方式只能有一个目标,说提升个人能力顺带发文章或者发文章中磨练个人能力都是骗人的,只是不小心发现还有另一个好处罢了。有两个目标的优化问题不好解;只有一个目标,还能求导,那就最方便了。

对读研究生的个人来讲,前者感觉师傅像欧阳锋,因为出成绩快,练一个礼拜就可以仗剑行江湖了;后者像所有武林正派一样慢,练了好多年终于有点小成,不过你要是在华山派就还可以练下去,在研究生院就要毕业了。至于他们会不会在十多年后重新站在同一起跑线上,不知道……

写写关于论文的焦虑

邻近毕业,有人在毕业游,有人结束了毕业游开始去公司实习,而我在修论文,一篇与毕业无关的论文。说实话,这是篇很糟糕的文章。刚开始做的时候太急,时间长了就看出来其实没啥理论贡献,有效性也值得商榷。

按审稿人意见补实验,证明某些条件下效果真的是没法看的。但是到这个份上已经没得商量了,老板改过,合作者改过,我更是投了大把时间进去。如果现在要退出,即使大家同意脸色也不会好看,而我要带着遗憾和浪费掉的时间滚蛋;如果硬撑下去,可能被二审毙掉,也有可能再改一轮,无论哪种,现在都没人能帮忙,只有删掉一部分代码,忽略之前浪费的时间,把论文和代码重新写下去。

写文章是一件很孤独的事,只有自己知道在做什么。审稿人可以轻轻松松让你补实验,这是最不用脑子的一件,每个方向都有大把文章,“你应该和这个比比”,所以最简单的审稿只要5分钟,而且内容还很充实,够作者玩几个月。至于改进工作的意见,审稿人八成是给不了的,即使有也会私藏。

某些时候,比如现在,写文章不是学术能力的问题,是能不能顶着压力在审稿意见里闪躲腾挪让文章看起来修改好了的能力。让审稿人看到诚意和工作量,一般人也就不敢说话了,文章新意也不太重要了。文章也许还是没修好,但是再扯下去面子上是不是过不去呢。刊发的文章经常会看到突兀的章节甚至自问自答,八成都是审稿人作祟。

再写下去有意义么?似乎没什么正面意义,多一篇文章对一个不走学术道路的人没意义,写一条转发量大的微博都有人感兴趣但这个没有;学一个10多年没人用的算法也没意义,茶余饭后也没人听这个;考验个人能力么,大概可以磨练磨练情绪控制能力,毕竟砸了不少东西了。唯一的意义是防御性的,不让在学校的最后几个月留下一个大大的失败,扯淡也要把文章再扔回审稿人手上。

写综述中

写了一个多月的综述终于有些成型了,这种应该能给老板一个初稿,心情放松了不少。再次发现了这条真理:写论文先把要写的东西都涂上去就好了,写再烂都没关系。从无到有是最难的一步;相比之下,把一篇烂文章改通顺则简单多了。

写论文会碰上各种障碍,比如写着写着意识到要画示意图,要插参考文献,这些并不是能够信手拈来的。插图要截图或者自己画,导出正确的格式,插一堆Latex代码,而参考文献需要找bib文件、改引用格式等等。所以第一稿论文完全可以不顾写得多烂、语言不通顺或者幼稚,能把需要的信息都放在文件里,让修改时能专注改语言改逻辑就很不错了。毕竟,就算写成小学生作文的风格,也是自己看。

尽管每次初稿快完成时都有这种隐约的顿悟感,但是下次从头写文章还是会被空白的文档束缚住,纠结篇幅不够、文字不通等等问题,仔细想想其实不必。

关于减肥

去年下半年胖了10斤,严重偏离正常水平。当时同时处理两篇文章的投稿和修改,另外还有撰写专利和找实习找工作等等事务。压力之下也就顾不得健康饮食,经常睡前吃牛油蛋糕、巧克力蛋糕等等高热量食物,的确能换得一时的爽快。不过久而久之体重也就上去了。

后来有段比较清闲的时光,打算减减肥。跑步、节食体重很轻松的剪掉了15斤,智能体重秤上显示脂肪率等等指标都达标了。

跑步之前讲过了,最难的部分是穿上运动鞋跑出去;

节食稍微有点难,每天回到家还是习惯性地渴望高糖高油的蛋糕。但是坚持几天基本就可以走上正轨。如果忍不住某天晚上吃了些零食,可能会再次进入一到晚上就熬不住想吃东西的困境。所以我的办法是回家水果管饱,虽然糖分也不少,总比蛋糕健康些。

另一个意外收获就是学会了吃蔬菜。以前当然也吃蔬菜,但总觉得食堂的蔬菜难吃至极,在学校总是基本是荤菜加点心的饮食配置。决心减肥后逼着自己吃了几天蔬菜,发现食堂的蔬菜还都挺不错的,除了青菜连着根偶尔带着消毒水味之外都可以接受,平均水平还比荤菜烧得好些。现在吃食堂也是蔬菜为主了。

所以减肥本身似乎没有给我带来直观的身体改善,倒是给我引荐了一堆好吃的蔬菜吧……

两种提问

昨天拉黑了一个不断向我提问的本科生。事情开始于上周五,这位好学的同学向我索取论文相关的代码,我欣然提供代码并表示有新的idea欢迎讨论。收到代码后这位同学立刻表示自己不会Python,并问我有没有Matlab版本,在我还没有来得及回复的时候他又要求我给他一些提示。被反复提了很多关于细节的问题后我劝他先看懂论文,代码只是辅助理解算法,理解了自己实现也很容易。沉寂了一天后这位同学问了我一个非常细节、可以简单百度到的问题。为了节省双方的时间我选择拉黑了这位同学。

所以,关于向作者提问,我的结论已经比较清晰了。论文都是经过反复修改后发表的,对于新方法的描述是最清晰的第一手资料,读者应该可以自己实现算法。当然向作者提问也是挺常见的事,但是要保证自己已经尝试寻找答案未果,也可以说说自己对问题的猜测。一上来拍10个代码层面的算法无关问题,一般人都会选择拉黑,脾气差一些或者会发一个北大青鸟的链接回去;如果一上来拍10个气势汹汹的算法细节问题,那就是审稿意见了……

处于审稿中的文章当然没有发表后的完善,所以提上10来个问题也正常。审稿中多解决问题正式为了以后不受邮件问题轰炸。评审提问和上面的提问又不一样,评审一般是揣着明白装糊涂,让作者自己归谬文章的错误。比较高级的可以质问文章的理论贡献是否充足;中规中矩的可以要求作者验证文章中的前提假设;最不济的就是要求作者补充更多的实验验证方法性能。

这时刊发前后的两种提问。

可卡因的趣闻

在图书馆翻倒一本《可卡因传奇》,内容多是南美毒枭和政变的纪实,对南美历史政治不熟悉的读者看起来比较费劲也不太有趣。不过有些趣闻还是挺有意思的:

可卡因的自然形态是古柯叶子,当地人有特殊的咀嚼技巧。咀嚼古柯叶子可以提醒脑消除疲劳,所以千百年来广受好评,并没有出什么茬子,大概纯度实在不高。从作者描述来看,咀嚼古柯叶对脑力和体力都很有帮助,不禁让人想到电影《永无止境》是不是关于可卡因的隐喻。

古柯叶在南美普及程度甚高,古柯还作为一个时间单位。一“古柯达”是嚼一卷古柯叶的时间,大概是45分钟。

弗洛伊德做过关于可卡因的研究,并一度认为可卡因可以治疗海洛因上瘾。并在自己的朋友身上尝试过,短期的似乎有效之后朋友染上了两种毒瘾……

最好的操作系统是什么

几乎每台我用过的电脑都被我装过Linux。家里的台式机被我装过各种发行版;大一买的第一台笔记本刚到手就把硬盘格式化了;半年前手贱把MacBookPro上的OSX格了,现在运行着SUSE。

但是这个过程其实有些像强迫症,因为它并没有什么愉快可言。很多计算机初学者被笼罩在“学计算机就要用Linux”、“爱折腾才能学好东西”这样的言论里,所以半强迫地逼着自己在各种机器上装了Linux。

不可否认Linux在某些方面的确有一些便利,比如各种命令行工具和大多数发行版方便的包管理工具。但是缺点也是很明显的,就是不适合办公、上网、玩游戏等等;真正需要使用命令行组合各种复杂用途的人其实少之又少。

硬把Linux和计算机专业扯上关系也没什么道理。因为计算机系的所学范围很广,大多数时候和Linux不发生半毛钱也可以学得很好。

另外,Android就是手机届的Linux吧,各种打折“发烧”旗帜发布的安卓手机,买回来的后果往往就是在口袋里发烫、掉电、真要用的时候自动关系打不了电话。要舒舒服服用一台Android手机可能自己要花上不少时间研究。而研究得来的知识的有效期大概也就是一两年左右,因为之后手机又更新换代。

所以,除非你是操作系统厂商,那最好的操作系统应该是最好用最适合工作内容的系统。比如经常写办公文档显然用Windows最好了;想轻松用手机还是多花点钱买个iPhone。一个正经操作系统的目标应该就是好用,而不是煅炼人的无用技能。

倒着画人像

本科的时候买过一本《五天学会绘画》,虽然名字听起来很山寨,但是书籍评价很高,是一本有“干货”的书。

不过我前两天刚刚尝试翻开它。这本书是作者的培训班教材,的确就是五天的训练,可以让完全没有绘画基础的人脱胎换骨,画出像样的画。

这本书的第一课就是倒着画一副肖像画,因为这时候大脑无法意识到那是一副人像,因此只好仔细临摹。我花了半个小时,画得不怎么样,但似乎是比正着画好一些。

尝试以一个民科的水平解释一下,大脑有负责人脸识别的专门区域,其他一些平日常见的目标可能也有一定的区域——尽管没有人脸对应的区域那么发达。这些大脑细胞如此发达以至于人还没看清目标时已经识别了目标。而倒着画的好处是这些区域不再能正常工作,大脑只要从视觉通路一步步处理,这样可以在画面每个细节长时间观察,并告诉手去临摹图像。也就是说,画画——至少画画入门的难点并不是绘画的技巧,而是观察的技巧。抛弃成见——以往识别事物的方式——可以更理性地对待目标。

了解信息和学习技能也是。在深入了解一件新事物前,别人只言片语的意见会很大的妨害自己看事物的方式。比如读研前听说读研就是给老师打工、或者读研就是多点时间出去实习等等,其实都不对。最好的方式是自己去看,读研干什么其实取决与自己想干什么和导师研究什么,自己看清楚了之后都是可以选择的。写论文之前听说要会这个算法那个算法、也有说要把PRML先看完的,其实也根本不用,一篇论文才一个实验,所以即使用到再学也可以发出文章。倒着画人像,其实就是用理性去观察。

计算机适合识别什么

模式识别现在似乎是个万灵药,找什么工作总可以和模式识别扯上点关系。而事实上只要牵涉到识别、估计的任务都的确可以用机器学习试一试。比如识别物体的ImageNet比赛、估计股价的量化模型等等。

这样技术似乎突破了十年前人们对计算机的印象,现在的计算机不但算数比人快,识别任务居然也可以做了。然而并不是,比如前阵子很火的百度拍照翻译,声称可以拍照识别图像中的目标,但基本上只是一个错的离谱的娱乐功能。另一方面,在某些情况下计算机的确能识别一些东西,例如从表情中识别人的情绪等等。那计算机究竟适合识别什么呢?目前看来是这样的:的确有迹可循、但是需要大量数据和经验积累的模式。

例如从表情和动作识别人的情绪、是否说谎等等。多年经验的老刑侦也许一年就能看穿嫌疑犯是否说谎,但是普通人一般是做不到的。而经验本身是可以从数据中获得的,只要给充分的数据,模式识别技术很容易完成这样的任务。

再如识别唇语。人脑有专门的人脸识别区域和表情识别区域,这是人的社交需求导致的自然选择,计算机要通过大量数据和简单算法在这些任务上超过人类很难,即使超过了意义也不特别大(大多数人不需要计算机告诉自己什么是笑、或者回到家里告诉自己谁是爸爸谁是妈妈,少数脑部损伤患者可能会需要这样的辅助),但唇语识别能力不是与生俱来的,没有脑部区域负责这样的任务,因此计算机只要做到百分之六七十的准确率就可以轻松超过人类。

行业研究员通过研究新闻、公司公告分析证券的未来走势,对投资者给出建议。而机器在处理本文的内涵信息方面也许稍弱,但是处理速度和内容覆盖面远远超过人类。因此也很有可能取代一部分人的工作。

各行各业应该都有这样极端以来经验的工作。正如依赖体力的工作被机器取代那样,未来依赖简单经验的工作也很容易被机器所取代。