写这篇博客是前几天看到别人分享 pluskid 的《关于知识整理、积累与记忆》,加之我自己一直以来也很关注这件事,也有一点点心得。整理出来自己回顾,和大家讨论。

pluskid 的这篇博文,可以解决大部分人对于知识整理的初级困惑,他的体会我相信大部分尝试做这件事人的也都感同身受。其实提炼看来,我觉得首先应该先清楚自己日常有哪些“知识”需要整理。这个因人而异,而且需要在你开始整理一段时间后,你才会慢慢明白你最需要的是什么知识。

因为现在摄入信息的迅捷,导致很多人有了“收藏癖”,看到觉得不错的信息,就大量转载,大量 Mark,大量放入收藏夹或者点击收藏按钮。这些碎片化的时间确实适合去收集/筛选我们可能需要的信息,但是除却碎片化的摄入时间,大部分人缺少的是整理时间。整理时间用来吸收和真正积累知识,没有它,收集来的信息只是笔记本中的内存,与你毫无关系。所以如果想开始进行知识整理,一定要养成一个固定的节奏去整理知识。

时间管理

相信大多数人和我一样,并不能保证每天都有时间进行信息整理。但是我至少会保证一周清理一次,就像整理桌面/Downloads文件夹/邮件一样。我要保证我至少有时间把这些信息进行第二次筛选

  • 哪些是“新闻类”的,看一遍就可以删除了,了解有这么回事就好;
  • 哪些是暂时不用看,但需要日后检索的,比如一些 Tutorials,暂时我认为没有时间看也无所谓,但是是很好的资源,如果日后系统学习会很有帮助,我会进行归类;
  • 哪些是我认为需要近期看的,那么我会对这类暂时不分类,也可以认为是分到了一个“近期看”的类别。

有了这样的二次筛选,至少可以保证我能进一步利用我的时间。如果我有碎片时间了,或者暂时换换脑子,我可以继续进行“未分类”的筛选工作;如果我有很多时间,想读一读信息,就可以看“近期看”里的具体的文章内容。这样基本形成了时间管理和知识管理的配对。

方法论

说完怎么初步管理,就可以说说知识管理的方法论了。其实我自己是觉得这玩意因人而异,我最推崇的就是,就好像“书读百遍,其义自现”,你只有坚持做了知识管理,自然摸索出了适合自己的方法。我现在这套方法,也是摸索了半年多。

这方面比较推荐的方法论可能李笑来的《把时间当做朋友》中有不少讨论的,刘未鹏《暗时间》里也有不少如何高效掌握知识的心理学建议。但是这两本书我其实都是碎片时间阅读的,他们在我看来是两本非常适合碎片化阅读的书,小节之间连贯性不强(相比小说和学术巨作),完全可以当一个个 Tag 来读。比如前者可以现在在线阅读,从每个加粗的小标题就能看到,就是一个个概念的讨论。大家完全可以自己定位到感兴趣的地方。

《把时间当做朋友》中的《第四章:学习》的结尾处关于学习心态的讨论其实和 pluskid 的博文观点差不多,对新知识保持开放的心态,让脑子转起来,这样才有可能开启更多的大脑“连结”,更能让自己的知识从长远角度形成网,加速触类旁通,也加速理解能力。在我看来,知识管理的目的就是为了更高效建立这样的网络并且把网络建立得更好

知识类别

其实从上面的“时间管理”部分也能看到,我们每天摄入并且想管理的知识是分类的。我们并不可能说完全只想管理我们的专业知识,同时我们可能也会对烹饪/英语学习/文学等知识很感兴趣。

最初进行知识管理时,很容易贪多。看到什么都会收藏,收藏完了以后都加标签等等整理进去。但是如果我们进行一段时间后的第三次整理,就会发现,很多知识我们并不是真的需要,或者我们归错类了。严格上说,把上文提到的“第二次筛选”“第三次整理”分裂开来是很难的,但是我姑且就先这样说吧。

当我们有时间了,开始面对自己二次筛选后的“原始知识”准备认真阅读、理解、掌握后,我们可能会在结束阅读后,给它们加上标签,或者归入一个类别。之所以这样做,是因为我们认为我们日后会再去查阅、再度消化这些知识,这就是第三次整理。但只有你进行了一段时间的知识管理后,你才会发现,你在“第三次整理”时会有许多你根本不想再看的东西;也有很多你认为不需要第四次消化的东西。这个不断的第三次-第四次-第五次的知识筛选过程,可以认为是无止境的,也可以认为是 pluskid 博文中提到的“分层”。在这样反复的过程中,就会逐渐对什么样的知识应该在“第几次”中被“消灭掉”有所认知。而这个认知,对于每个人都是不一样的。

所以,我们的知识类别也会在这个过程中逐渐清晰,每天关注的东西也会越来越集中。同时,只要能保证一定频率的知识三次、四次整理,就可以保持自己的收藏夹“原始知识”的量维持在一个范围内,不会持续增长。

标签管理

在第三次整理开始后,大部分人,包括我,都会选择用分类、标签两种方式进行初步的知识管理。不过就我个人来说,我基本不用分类。关于分类和标签的区别其实很多 UCD 的书中都讲了很多,现在已经没啥人再讨论了。我觉得越来越多的用户已经习惯了用标签去做分类的事情。不过标签管理的问题就是粗细粒度的混杂。如果非要把分类和标签区别开来,我认为就是分类更粗粒度,标签更细粒度。

但是,既然是自己的知识管理,粗细粒度完全可以自己掌握。找一个顺手的就好。而这个顺手首先就取决于你的“原始信息”的获取来源。拿我自己来说,我有很大程度是在新浪微博上获取原始信息。新浪微博的微博收藏功能同时可以添加两个标签,两个,其实对我来说有点少,但也强制了我建立了逐步顺手的标签。所以第二部就是取决于你自己如何管理。这个过程也是需要长期积累,进化而来。

以我个人的经验,最初的标签可能会有许多粗粒度的和不规范的情况。先说粗粒度问题,比如我比较关注机器学习、自然语言处理这些,那么我会有大量的标签是 ML/NLP,可是当我第三次第四次进行加工的时候,我会发现太多这样的标签导致这样的标签变得无用了,我就逐步需要加入这些是 DL 的,那些是 Topic Model 的,这些是 optimization 的,等等。这样的细粒度标签的加入使得我在之后的第二次筛选时,就会直接加入细粒度的标签,使得粗粒度的标签逐步被淘汰。实现了又一次“分层”。另一件事,细粒度的标签下的知识可能很容易“过时”,比如 Topic Model,现在可能基本已经没啥人用了,我也基本都掌握了,那我可能就会找个时间把这些细粒度的标签下的知识整理一遍,仍然没掌握的留下,已经掌握或者已经过时不再需要掌握的(有些 Model 比如)就会删掉。

最初的标签的第二个问题就是不规范问题。比如我要关注烹饪或者家居的一些东西。我可能最初第一次给一个帖子加的标签是“做饭”“家居”,第二次我给忘了,我给同样另一个类似的帖子加成了“食谱”“生活”。这样就完成导致了找标签的时候找不到的问题。不过这件事其实已经可以通过 NLP 的 word embedding 解决了,而且感谢新浪微博,新浪微博的标签收藏功能逐步进化已经可以实现我查找“健身”,把“减肥”“塑形”的标签都一起给我返回了。不过我是想说,只有在你逐步去进行这件事,持之以恒去做,你的标签才会越来越规范,越来越熟练。这跟 Coding Style 我觉得是一个问题……

加工知识

刚才在“知识类别”的部分我一直提到了“原始知识”,指的是还存在于原始收集平台里的知识,包括那些已经加了标签和没有加标签的。在我们经过第三次或者第三次整理吸收后,会逐步有一些原始知识形成了一小类。比如 word embedding 这个类吧。

此时,我找了一个时间,把这些类下的文章/论文/代码/博客都看了一遍,或者看了其中一部分吧。我很有感触,很有收获,随着我看的过程,我有了一些高亮,一些摘录,一些 note。这时我就需要把我认为这些精华中的精华整理出来,这个过程我认为就是“加工知识”。完成了这个过程,才是“原始知识”的吸收完毕。这个过程其实对于每个人来说应该是最容易找到自己的方法的,可是大部分人都会在这一步之前就凌乱了。

我认为这样从第三次或者第四次整理后再积累再一起吸收,有非常大的好处。像我去年年末的年度总结里说的

  • sequential 的回顾学习,温故知新是一定的;
  • 完全掌握了的东西,把它们 pop out 自己的待读列表里,成就感棒棒的;
  • 除了硬知识的收获,更多地可以关注自己软思维的成长。

最大的好处就是你可以更好地把知识和知识之间联系在一起。让我再用 The Morning Paper 博客中博主提到的说法表达一下,当他读完一篇 paper 后他不会立刻去写总结,而是会消化一段时间:

I let the ideas in the paper swirl around in the back of my mind. Sometimes consciously, sometimes unconsciously - but this ‘thinking time’ definitely seems to help me. If I’ve read a paper on the train into work for example, I’ll think aout it while walking from the station to the office (about 20 mins) - after which it will be relegated to my subconscious.

其实这段话中就是提到了潜意识。当我们长久地专注于一个问题时,我们的潜意识就会开始工作,甚至于睡觉的时候也会继续运转。这方面的内容也在刘未鹏的《暗时间》里有所讨论。

至于加工知识整理到哪里,依然是因人而异。许多人推崇电子化,就我个人来说,手写笔记和电子化都是必不可少的。手写快速、随意、不被格式拘束(尽管有 Markdown 等等,有些图啊还是不好画啊);电子化是因为很多时候一手资源就是电子的,但是电子很费时间,却适合信息量很大的……

使用软件和平台

这一部分中涉及到了原始知识和知识加工两步用到的软件和平台,只是我个人。

###新浪微博 我用来收集学术信息、生活技能(烹饪)、文学信息,和最重要的一个,别人的感想。微博上有很多人非常愿意分享自己的思考,这些思考可能很多是关于自己职场的、或者关于自己对行业的见解,很难归类,但是对我而言却非常有启发。我自己是把这些贴上“insight”标签。

###Instapaper/Kindle/Pocket/RSS 这几个基本一个功能。我要看的一些长文章,又适合碎片化读的,移动时间读的,就存在 Instapaper 里(我自己用这个)或者推送到 Kindle 上。读完有用的就加星收藏,有空时整理,没用的就直接删掉。

###Evernote/OneNote等 用来做“知识加工”的。没啥好说的。

###IFTTT 这是辅助软件,可以保证 Instapaper 到 Evernote 啊或者 Instapaper 到其他社交账号的同步性。可有可无。

###Excel 这个其实我前阵子看纯银的文章里提到的,他长期坚持的习惯有一个是统计数据。

第六是统计数据,我有一张大表,上百项数据,每个月手动统计一次均值填进去,大约花两三个小时。此事枯燥无趣,当然可以交出去,但我不乐意。统计这些数据的过程,也是我不断猜测,不断印证,不断分析数据的过程,增进我对数据的理解,以及由此衍生出来的新的想法,远远超过看着人家的统计表格,花5分钟时间吃顿快餐。

这是他的职业导致。但是其实每个行业都可能需要有一些这样的 trending 的知识要长期保存,自己选择自己需要的自己制作整理。也可以用来记录自己的一些进展数据。我觉得是必须的。

日记

说到比较私人的,我自己还是有写日记的习惯的。虽然不一定真的每天都写,但四五天写一次补全每天的是基本做到的。我的日记不太会每天都写流水账,但是会有几个部分(也是我完善后的)。

一页纸分为四个区域,第一个区域是页头,就是一般日记本都有的日期/星期/节日什么的,这个区域对我来说是有用的;第二个区域是 checkbox 计划区;第三个区域是大面积的自由发挥区;第四个区域是 item 记录区。下面分别说一下每个区的作用:

  • 页头,我会用来写一些备忘事项,比如理财到期,比如家人生日,比如比赛时间等等;第二点我会用来记录一天的完成度,这个和第二个区域的计划密切相关,如果我当天按时完成了全部计划,我会直接打一个对勾,如果当天还有遗留的没做完,就空着,如果事后某天把今天的事情都做完了,就打个半对勾(对勾上加一点),这样很方便我查看我的完成度,对自己有个了解,也可以很好的记录自己的事情有哪些没做完;第三个点是我会贴一些提醒式的贴画(笔记本送的),比如笔记本送了一堆星星的贴纸,我用来表示今天有一些 insight 的事情发生,比如今天老板找我聊天时我有很大的启发,或者今天有个重大的实验 idea,反正别管什么吧,我觉得我可以日后查看的,我就会在今天的页头贴一个星星。
  • checkbox 计划,这是页头下第一部分,就像 Evernote 的 checkbox 功能一样,我自己画小方格,记录今天都要做什么,比如开会,比如完成论文初稿,比如跑步……然后要真的 check。这个就是短期计划,我会基本提前定好三到五天的计划,同时也可能会比如过几个月有一件事要做,我就提前翻到日记本的那页加上去。这个当然是可以通过手机 App 替代的,只是配合上上一个页头的记录,我会觉得对自己的成长和计划完成度了然于胸。当我今天全部按时完成,我就打一个勾,没完成就空。
  • 自由发挥区,如果我今天很开心,有很多感受,我就会写写写写,写今天的心情;如果我今天没啥感受没啥要写的,我就空着,留待摘录一些我喜欢的东西,别管是文学作品还是微博 insight。
  • item 记录区。我主要用来记录两个,一个是看书,一个是看电影。写在日本一页的最底部,如果今天有看完一本书,就写下书名和简评,算作自己的另一个记录。

关于做计划这件事,李笑来也有讨论

笔记

这事个人风格太强,有兴趣就直接看看同人于野写的如何做笔记

Paper Reading

虽然比如像上文提到的 The Morning Paper 的博主说的,他会用 Mendeley 等软件管理自己的 paper,我自己用过 Mendenley 和 Zotero 都不太适应。对我来说太麻烦,我觉得读过的好 paper 如果记住了就是记住了,没记住就算了……实在我也没时间老看。

我看 paper 的方法和 pluskid 很像。我比较喜欢先看 Introduction,了解清楚作者想解决的 problem/task 是什么,然后时间紧张就不去看 related work,就直接看 model 的输入输出了。一般好的 paper 会在 model 部分也点明自己用 model 的 motivation,为什么选择这样,为什么在这里做了修改等等,这些是我比较关注的。如果有兴趣,就进一步追溯 References。

以前有条件就喜欢打印出来看,现在条件不允许又有了神器 DPT-S1,就直接电子版加电子 note 了。highlight 加上批注。整理到别的地方。

总的来说就是这样了。

Highway Networks and Deep Residual Networks

Recently, a breakthrough news spread over social networks. In this post, I will explain this ResNet as a special case of Highway Networks, which has been proposed before. Both of the work is amazing and thought-provoking. Continue reading

NIPS 2015 Deep Learning Symposium Part II

Published on January 09, 2016

NIPS 2015 Deep Learning Symposium Part I

Published on December 11, 2015