实操性很强的阅读文献方法（台湾彭明辉教授）

2022-08-05

Archive

找到了一份实操性很强的读文献方法。

摘要

找到了一份实操性很强的读文献方法，来自台湾清华大学彭明辉教授《研究生手册》，个人觉得比较实用，操作性很强。英文文献的阅读速度提升只在你训练的时间上，所谓巧妇难为无米之炊，多阅读就好了（坚持每天读文献一个月左右可明显提升），最重要的是有一种好的方法指导，才能少走弯路，避免浪费时间！（猛男落泪）

摘录了第4-7节与读论文相关的内容，第4、6、7节推荐阅读，第5节有点啰嗦可跳过。有需自取~

四、期刊论文的分析技巧与步骤

一般来讲，好的期刊论文有较多的创意。虽然读起来较累，但收获较多而深入，因此比较值得花心思去分析。读论文之前，参考SCIImpactFactor及学长的意见是必要的。

一篇期刊论文，主要分成四个部分。

（1）Abstract：

说明这篇论文的主要贡献、方法特色与主要内容。最慢硕二上学期必须要学会只看Abstract和Introduction便可以判断出这篇论文的重点和你的研究有没有直接关联，从而决定要不要把它给读完。假如你有能力每三十篇论文只根据摘要和简介便能筛选出其中最密切相关的五篇论文，你就比别人的效率高五倍以上。以后不管是做事或做学术研究，都比别人有能力从更广泛的文献中挑出最值得参考的资料。

（2）Introduction：

Introduction的功能是介绍问题的背景和起源，交代前人在这个题目上已经有过的主要贡献，说清楚前人留下来的未解问题，以及在这个背景下这篇论文的想解决的问题和它的重要性。对初学的学生而言，从这里可以了解以前研究的概况。通常我会建议初学的学生，对你的题目不熟时，先把跟你题目可能相关的论文收集个30~40篇，每篇都只读Abstract和Introduction，而不要读MainBody（本文），只在必要时稍微参考一下后面的Ilustrativeexamples和Conclusions，直到你能回答下面这三个问题：

（2A）在这领域内最常被引述的方法有哪些？

（2B）这些方法可以分成哪些主要派别？

（2C）每个派别的主要特色（含优点和缺点）是什么？

问题是，你怎么去找到这最初的30~40篇论文？

有一种期刊论文叫做「reviewpaper」，专门在一个题目下面整理出所有相关的论文，并且做简单的回顾。你可以在搜寻Compendex时在keywords中加一个「review」而筛选出这类论文。然后从相关的数篇reviewpaper开始，从中根据title与Abstract找出你认为跟你研究题目较相关的30~40篇论文。通常只要你反复读过该领域内30~40篇论文的Abstract和Introduction，你就应该可以从Introduction的评论中回答（2A）和（2B）这两个问题。尤其要记得，当你阅读的目的是要回答（2A）和（2B）这两个问题时，你一定要先挑那些Introduction写得比较有观念的论文念（很多论文的Introduction写得像流水帐，没有观念，这种论文刚开始时不要去读它）。假如你读过假如30~40篇论文的Abstract和Introduction之后，还是回答不了（2C），先做下述的工作。

你先根据（2A）的答案，把这领域内最常被引述的论文找齐，再把他们根据（2B）的答案分成派别，每个派别按日期先后次序排好。然后，你每次只重新读一派的Abstract和Introduction（必要时简略参考正文，但目的只是读懂Introduction内与这派有关的陈述，而不需要真的看懂所有正文），照日期先后读，读的时候只企图回答一个问题：这一派的idea与主要诉求是什么？这样，你逐派逐派地把每一派的Abstract和Introduction给读完，总结出这一派主要的诉求、方法特色和优点（每一篇论文都会说出自己的优点，仔细读就不会漏掉）。其次，你再把这些论文拿出来，但是只读Introduction，认真回答下述问题：「每篇论文对其它派别有什么批评？」然后你把读到的重点逐一记录到各派别的「缺点」栏内。

通过以上步骤，你就应该可以掌握到（2A）、（2B）、和（2C）三个问题的答案。这时你对该领域内主要方法、文献之间的关系算是相当熟捻了，但是你还是只仔细读完Abstract和Introduction而已，内文则只是笼统读过。

这时候，你已经掌握到这领域主要的论文，你可以用这些论文测试看看你用来搜寻这领域论文的keywords到底恰不恰当，并且用修正过的keywords再搜寻一次论文，把这领域的主要文献补齐，也把原来30~40篇论文中后来发现关系较远的论文给筛选掉，只保留大概20篇左右确定跟你关系较近的文献。如果有把握，可以甚至删除一两个你不想用的派别（要有充分的理由），只保留两、三个派别（也要有充分的理由）继续做完以下工作。

然后你应该利用（2C）的答案，再进一步回答一个问题（2D）：「这个领域内大家认为重要的关键问题有哪些？有哪些特性是大家重视的优点？有哪些特性是大家在意的缺点？这些优点与缺点通常在哪些应用场合时会比较被重视？在哪些应用场合时比较不会被重视？」然后，你就可以整理出这个领域（研究题目）主要的应用场合，以及这些应用场合上该注意的事项。最后，在你真正开始念论文的mainbody之前，你应该要先根据（2A）和（2C）的答案，把各派别内的论文整理在同一个档案夹里，并照时间先后次序排好。然后依照这些派别与你的研究方向的关系远近，一个派别一个派别地逐一把各派一次念完一派的mainbodies。

（3）Mainbody（含simulationand/orexperimentalexamples）：

在你第一次有系统地念某派别的论文mainbodies时，你只需要念懂：

（3A）这篇论文的主要假设是什么（在什么条件下它是有效的），并且评估一下这些假设在现实条件下有多容易（或多难）成立。愈难成立的假设，愈不好用，参考价值也愈低。

（3B）在这些假设下，这篇论文主要有什么好处。

（3C）这些好处主要表现在哪些公式的哪些项目的简化上。

至于整篇论文详细的推导过程，你不需要懂。除了三、五个关键的公式（最后在应用上要使用的公式，你可以从这里评估出这个方法使用上的方便程度或计算效率，以及在非理想情境下这些公式使用起来的可靠度或稳定性）之外，其它公式都不懂也没关系，公式之间的恒等式推导过程可以完全略过去。假如你要看公式，重点是看公式推导过程中引入的假设条件，而不是恒等式的转换。

但是，在你开始根据前述问题念论文之前，你应该先把这派别所有的论文都拿出来，逐篇粗略地浏览过去（不要勉强自己每篇或每行都弄到懂，而是轻松地读，能懂就懂，不懂就不懂），从中挑出容易念懂的papers，以及经常被引述的论文。然后把这些论文照时间先后次序依序念下去。记得：你念的时候只要回答（3A）、（3B）、（3C）三个问题就好，不要念太细。这样念完以后，你应该把这一派的主要发展过程，主要假设、主要理论依据、以及主要的成果做一个完整的整理。其次，你还要在根据（2D）的答案以及这一派的主要假设，进一步回答下一个问题：（3D）这一派主要的缺点有哪些。最后，根据（3A）、（3B）、（3C）、（3D）的答案综合整理出：

这一派最适合什么时候使用，最不适合什么场合使用。

记住：回答完这些问题时，你还是不应该知道恒等式是怎么导出来的！

当你是生手的时候，你要评估一个方法的优缺点时，往往必须要参考它Examples。但是，要记得：老练的论文写作高手会故意只present成功的案例而遮掩失败的案例。所以，simulationexamplesand/orexperiments很棒不一定表示这方法真的很好。你必须要回到这个方法的基本假设上去，以及他在应用时所使用的主要公式（resultantequations）去，凭自己的思考能力，并且参考（2C）和（2D）的答案，自己问问看：当某某假设在某些实用场合上无法成立时，这个方法会不会出什么状况？猜一猜，预测一下这个方法应该会在哪些条件下（应用场合）表现优异，又会在哪些条件下（应用场合）出状况？根据这个猜测再检验一次simulationexamplesandorexperiments，看它的长处与短处是不是确实在这些examples中充分被检验，且充分表现出来。

那么，你什么时候才需要弄懂一篇论文所有的恒等式推导过程，或者把整篇论文细细读完？NEVER！你只需要把确定会用到的部分给完全搞懂就好，不确定会不会用到的部分，只需要了解它主要的点子就够了。

硕士生和大学生最主要的差别：大学生读什么都必须要从头到尾都懂，硕士生只需要懂他用得着的部分就好了！大学生因为面对的知识是有固定的范围，所以他那样念。硕士生面对的知识是没有范围的，因此他只需要懂他所需要的细腻度就够了。硕士生必须学会选择性的阅读，而且必须锻炼出他选择时的准确度以及选择的速度，不要浪费时间在学用不着的细节知识！多吸收「点子」比较重要，而不是细部的知识。

五、方法与应用场合特性表（有迹可寻的创意步骤）

（这一节有点啰嗦，可直接看加粗部分，其他跳过）试着想象说你从上图中论文阅读步骤的第（4）与（5）步骤分别获得以下两张表：

https://pic1.zhimg.com/50/v2-5f10d63538da891e081a28e8b55d9a4e_720w.jpg?source=1940ef5chttps://pic1.zhimg.com/80/v2-5f10d63538da891e081a28e8b55d9a4e_720w.jpg?source=1940ef5c

譬如，当你的题目是「如何标定fiducialmark之中心位置」，你就必须要仔细搜寻出文献上所有可能可以用来做这一个工作的方法。或许你找到的方法一共有四种，依序如下。譬如（随便乱举例），「方法一」可能表示：「以面积形心标定fiducialmark之中心位置」，「方法二」可能表示「以Hughtransform标定fiducialmark之中心位置」，「方法三」可能表示：「以局部弧形matching的方法标定fiducialmark之中心位置」，「方法四」可能表示：「以ringcode标定fiducialmark之中心位置」。

这些方法各有它的特色（优缺点），譬如（随便乱举例），特性1可能表示「计算速度」（因此，根据上表左边第一个row，可以发现：方法一的计算速度很快，方法二与方法三的计算速度很慢，而方法四的计算速度普通。其次，特性2可能代表，「光源高度不稳定时计算位置的误差大小」，特性3可能代表「噪声对计算出的位置干扰多大」，特性4可能代表「图形边缘有破损时计算的可靠度」，特性5可能代表「对象有彼此的遮蔽时方法的适用性」等等。所以，以上左图中第五个row为例，可以发现：当对象有彼此的遮蔽时，除方法二之外其它三个方法的适用性都很好。

但是，同样一个方法可能有许多不同的应用场合，而不同应用场合可能会对适用（或最佳）的方法有不同要求。所以，让我们来看右边的「问题特性分析表」。譬如（随便乱举例），应用甲可能是「标定fiducialmark之中心位置」的方法在「电路插件组装（SMT）」里的应用，应用乙可能是「标定fiducialmark之中心位置」的方法在「生物检验自动化影像处理」里的应用，而应用丙则可能是「标定fiducialmark之中心位置」的方法在「巡义飞弹目标搜寻」里的应用。这三种应用场合更有其关注的特性。譬如，根据上面右表第二个row的资料，三种应用场合对特性2（光源高度不稳定时计算位置的误差大小）都很在意。再譬如，根据上面右表第四个row。的资料，三种应用场合中除了应用甲（电路插件组装（SMT））之外，其它两种应用场合对特性4（图形边缘有破损时计算的可靠度）都很在意。那么，四个方法中哪个方法最好？你可能会回答说：「方法二！因为它的优点最多，缺点最少。」但是，这样的回答是错的！一个方法只有优缺点，而没有好坏。

当它被用在一个适合表现其优点而不在乎其缺点的场合里，它就显得很好；但是，当它被用在一个不适合表现其优点而很在乎其缺点的场合里，它就显得很糟。譬如，方法二在应用场合乙，它的表现会非常出色（因为所有的优点刚好那个应用场合都在意，而所有的缺点刚好那个应用场合都不在意）；但是，方法二在应用场合甲里它的表现却会非常糟糕（它所有的缺点刚好那个应用场合都很在意，而它大部分的优点刚好那个应用场合却都不在意）。所以，必须要学会的第一件是就是：方法没有好坏，只有相对优缺点：只有当方法的特性与应用场合的特性不合时，才能下结论说这方法「不适用」；二当方法的特性与应用场合的特性吻合时，则下结论说这方法「很适用」。因此，一定要同时有方法特性表与应用场合特性分析表放在一起后，才能判断一个方法的适用性。

更重要的是：上面的方法与问题分析对照表还可以用来把「突破瓶颈所需的创意」简化成一种「有迹可寻」的工作。譬如，假定我们要针对应用甲发展一套适用的方法，首先我们要先从上右表中标定这个应用场合关心哪些问题特性。根据上右表第一个column，甲应用场合只关心四个特性：特性1、2。3、5（即「计算速度」、「光源高度不稳定时计算位置的误差大小」、「噪声对计算出的位置的干扰」、「对象有彼此的遮蔽时方法的适用性」）。那么，哪个方法最适用呢？看起来是方法一，它除了特性2表现普通之外，其它三个特性的表现都很出色。但是，假如我们对方法一的表现仍不够满意，怎么去改善它？最简单的办法就是从上左表找现成的方法和方法一结合，产生出一个更适用的方法。因为方法一只有在特性2上面表现不够令人满意，所以我们就优先针对在特性2上面表现出色的其它方法加以研究。根据上左表，在特性2上面表现出色的方法有方法二和方法四，所以我们就去研究这两个方法和方法一结合的可能性。或许（随便举例）方法四的创意刚好可以被结合进方法一而改善方法一在特性2。上面的表现，那么，我们就可以因此轻易地获得一个方法一的改良，从而突破甲应用场合没有适用方法的瓶颈。有没有可能说单纯常识结合既有方法优点仍无法突破技术瓶颈的状况？可能有。这时候真的需要完全新颖的创意了。但是，这种时候很罕见。多半时候只要应用上一段的分析技巧就可以产生足以解决实用问题的创意了。至少，要产生出一篇学术期刊论文并非那么困难。

六、论文阅读的补充说明

硕士生开始学读期刊论文时，就容易犯的毛病就是戒除不掉大学部的习惯：

（1）老是想逐行读懂，有一行读不懂就受不了。

（2）不敢发挥自己的想象，读论文像在读教科书，论文没写的就不会，瘫痪在那里；被我逼着去自己猜测或想象时，老怕弄错作者的意思，神经绷紧，脑筋根本动不了。

大学毕业后（不管是念硕、博士或工作），可以参考的资料都没有秩序地交错成一团，而且永远都读不完。用大学生的心态读书，结果一定时间永远不够用。因此，每次读论文都一定要带着问题去读，每次读的时候都只是图回答你要回答的问题。因此，一定是选择性地阅读，一定要逐渐由粗而细地一层一层去了解。上面所规划的读论文的次序，就是由粗而细，每读完一轮，你对这问题的知识就增加一层。根据这一层知识就可以问出下一层更细致的问题，再根据这些更细致的问题去重读，就可以理解到更多的内容。因此，一定是一整批一起读懂到某个层次，而不是逐篇逐篇地整篇一次读懂。

这样读还有一个好处：第一轮读完后，可以根据第一轮所获得的知识判断出哪些论文与你的议题不相关，不相关的就不需要再读下去了。这样才可以从广泛的论文里逐层准确地筛选出你真正非懂不可的部分。不要读不会用到的东西，白费的力气必须被极小化！其实，绝大部分论文都只需要了解它的主要观念（这往往比较容易），而不需要了解它的详细推导过程（这反而比较费时）。

其次，一整批一起读还有一个好处：同一派的观念，有的作者说得较易懂，有的说得不清楚。整批读略过一次之后，就可以规划出一个你以为比较答易懂的阅读次序，而不要硬碰硬地在那里撞墙壁。你可以从甲论文帮你弄懂以论文的一个段落，没人说读懂甲论文只能靠甲论文的信息。所以，整批阅读很像在玩跳棋，你要去规划出你自己阅读时的「最省力路径」。

大学生读东西一定要循规蹈矩，你还没修过机械视觉相关课程之前可能也只好循规蹈矩地逐行去念。但是一旦修过机械视觉相关课程，许多论文中没被交代的段落你也已经可以有一些属于你的想象（虽然有可能猜错，尤其刚开始时经常猜错，但没关系，下面详述）。这些想象往往补足论文跳跃处最快速的解决方案。其实，一个大学毕业生所学已经很多了，对许多是都可以有一个不太离谱的想象能力。但是大部分学生却根本不敢去想象。我读论文远比学生快，分析远比学生深入，主要的是我敢想象与猜则，而且多年训练下来想象与猜测的准确度很高。所以，许多论文我根本不是「读懂」的，而是「猜对」了！

假如猜错了怎么办？不用怕！猜完一后要根据你的猜测在论文里找证据，用以判断你的猜则对不对。猜对了，就用你的猜测（其实是你的推理架构）去吸收作者的资讯与创意（这会比从头硬生生地去迁就作者的思路轻松而容易）；猜错了，论文理会有一些信息告诉你说你错了，而且因为猜错所以你读到对的答案时反而印象更深刻。

七、论文报告的要求与技巧

报告一篇论文，我要求做到以下部分（依报告次序排列）：

（1）投影片第一页必须列出论文的题目、作者、论文出处与年份。

（2）以下每一页投影片只能讲一个观念，不可以在一张投影片里讲两个观念。

（3）说明这篇论文所研究的问题的重点，以及这个问题可能和工业界的哪些应用相关。

（4）清楚交代这篇论文的主要假设，主要公式，与主要应用方式（以及应用上可能的解题流程）。

（5）说明这篇论文的simulationexamplesand/orexperiments，预测这个方法在不同场合时可能会有的准确度或好用的程度

（6）你个人的分析、评价与批评，包括：

（6A）这篇论文最主要的idea是什么？

（6B）这些idea在应用上有什么好处？

（6C）这些idea和应用上的好处是在哪些条件下才能成立

（6D）这篇论文最主要的缺点或局限是什么？

（6E）这些缺点或局限在应用上有什么坏处？

（6F）这些缺点和应用上的坏处是因为哪些因素而引入的？

（6G）你建议学长学弟什么时候参考这篇论文的哪些部分（点子）？

一般来讲，刚开始报告论文（硕一上学期）时只要做到能把前四项要素说清楚就好了，但是硕一结束后（署假开始）必须要设法做到六项要素都能触及。硕二下学期开始的时候，必须要做到六项都能说清楚。

注意：读论文和报告论文时，最重要的是它的idea和观念架构，而不是数学上恒等式推导过程的细节（顶多只要抓出关键的equation去弄懂以及说明清楚即可）。你报告观念与分析idea，别人容易听懂又觉得有趣；你讲恒等式，大家不耐烦又浪费时间。