博主最近在接触一些 Android 单元测试方面的工作,发现自己并没有体会到大多数文章所宣传的 “单元测试会带来工作效率的巨大提升” 之类的诸多好处,于是本着批判与自我批判的精神对单元测试做了一番研究,以下言论仅代表个人观点,如果不足,欢迎指教。
当你看到网上诸多关于单元测试的赞美时,仔细看看你就会发现很多说的其实是 TDD(Test-Driven Development,测试驱动开发),不幸的是大多数人并没有注意区分这两个概念。在Writing Great Unit Tests: Best and Worst Practices中,Steven Sanderson 强烈表达了自己的观点:Unit testing is not about finding bugs。简单来说,当先写代码后写单元测试的时候,单元测试就成了一种发现 Bug 的手段,但作者根据其几十年的开发经验指出这种手段其实是十分低效的,因为即使每个功能模块都能正常工作,但是仍然不能保证模块之间、模块与用户环境之间能正确交互,而后者往往是 Bug 的主要来源。单元测试或许能找到一些 Bug,但相比集成测试和系统测试就显得十分低效了。
既然如此,那么单元测试为何又备受追捧呢?在How Google Tests Software中,三位谷歌的专家介绍了谷歌的软件测试之道,总而言之就是谷歌会在开发之初设计好单元测试(其实是用代码表达需求),在开发中不断迭代以通过全部的测试(其实是完成全部需求),最终交付给测试人员的软件已经经过一轮测试,如果还有集成后的 Bug,就可以交给专业的测试人员发现了。这是一种典型的敏捷开发,可以看到单元测试扮演更多的是驱动开发的角色。
作为技术标杆的谷歌已经全面引入了单元测试,那么我作为一个普通开发者为什么还要提出一番质疑呢?请看下一节。
在经济学领域,有一个著名的边际收益递减规律,指在投入生产要素后,每单位生产要素所能提供的产量增加发生递减(二阶导数为负)的现象。在本文讨论的场景中,投入产出如下(引自:软件开发过程中值不值得写单元测试? - voidint's blog):
成本 (投入)
- 编写单元测试用例所额外付出的时间,短期内会拖慢项目进度。
收益 (产出)
- 提升代码质量。监督开发人员写出更加易于测试和可维护的代码。
- 提升开发团队内部的协作效率。其他开发人员可以通过阅读单元测试用例来理解代码原作者的意图。
- 保证功能实现的长期稳定。代码一旦发生与原功能意图不相符的变化,通过跑单元测试可以体现出来,即可以防止功能被无意识地破坏。
- 提高自动化测试占比,降低其他测试方式上的投入。
在经济学中,边际收益递减现象常出现于产量的短期分析中。结合对同事的咨询以及自己的调研,这个现象在软件开发领域同样适用。当我们需要写原型或者开发一个短期紧急需求的时候,(产品、运营人员)往往要求快速交付,并且由于代码规模有限也往往不会有太多 Bug,在这种短期开发中如果引入单元测试往往会适得其反,投入了双倍的时间却没有明显的附加收益。而分析How Google Tests Software一书中最多提及的几个项目(Chrome,Android,Gmail)可以发现,单元测试(更准确说是 Test-Driven Development)的成功案例往往都是一些架构设计良好,处于长期迭代开发,基本没有短期临时紧急需求的产品,项目初期的单元测试往往在几年后还能使用,复用率极高(私以为复用率某种程度上可以作为是否值得引入单元测试的标准)。而如果一个项目一开始没有引入单元测试、过时和糟糕的代码没有及时重构、临时短期需求偏多,往往就没有引入单元测试的必要了。
Jake Wharton 何许人也?答:诸多著名开源项目的作者,Android 社区的旗帜人物:
[图片上传失败...(image-547317-1523347911909)]
Jake Wharton 对于 Android 平台的单元测试也十分头痛(Against Android Unit Tests),其原因也是我调研并写下本文的原因。Android 相对于其他开发环境有以下几个特点:
可以想象,当你投入大量精力,使用Robolectric、Mockito等框架模拟出一个将数据库数据发往后台的单元测试并通过测试用例后,用户却因为切换网络等小概率场景触发了 Bug,你会不会感叹我要这单测有何用?类似 Android 这种终端环境,其边际收益递减的临界点往往更容易达到,引入单元测试犹需谨慎。
结合上面的分析,哪些场景不适合做单元测试已经显而易见了,When is unit testing inappropriate or unnecessary? [duplicate]中一个高票回答做了如下总结:
- The code has no branches is trivial. A getter that returns 0 doesn't need to be tested, and changes will be covered by tests for its consumers.
在Definition of brittle unit tests中也有详细总结,都有一定参考价值。
此外,有了适合单元测试的场景并不代表就有适合单元测试的代码。在 TDD 模式中,测试先于开发,所以开发部分的代码接口往往需要经过良好的设计和定义,最好能解耦各个模块,如此开发代码将能够完美匹配测试代码。但这种开发模式往往对开发经验、设计能力要求很高。能都达成此境界的已经是 TDD 的行家了。然而事实是对于没有单元测试经验的开发人员而言,往往没有意识到自己写的代码 “不可测试”。以下面伪代码为例:
object processObject(Object object) {
if (object == objectA) {
log.i('error 1 ....')
return object;
}
if (object == objectB) {
log.i('error 1 ....')
return object;
}
.....
return object;
}
开发人员在 Debug 的时候,能根据 log 信息快速定位问题,但对于测试来说就十分不友好了:返回值都一样。如果想要领会单元测试的优越性,短期的镇痛与适应似乎是不可避免的。
本文没有讨论 TDD 的各种优势,也没有讨论单元测试的最佳实践,是个人的一些总结,讨论的是单元测试的一些局限之处,或许有不足、有遗漏,又或者完全错误,欢迎拍砖。譬如,在 stackoverflow 上有一个关于是否值得做单元测试的问题就因为其争议性而被关闭回答,而又因为有其存在的历史意义而被一直锁定 (locked),感兴趣可以看看:
[图片上传失败...(image-8d7ff-1523347911910)]
链接:Is Unit Testing worth the effort? - Stack Overflow
本文讨论的只是单元测试(TDD)的局限性,在合适的场景中其作用是巨大的,尤其是轮子级、框架级和开源项目中,了解单元测试也大有裨益。比如,我在为 ChatteBot 提交代码时,就因为当时不了解单元测试的作用,只修改了代码 Bug 而没有修改测试代码的错误(测试代码写错真是没救了)。我也因此失去了成为一个 5000+ star 开源项目贡献者的机会.....
[图片上传失败...(image-655ca6-1523347911910)]
「软件匠艺社区」旨在传播匠艺精神,通过分享好的「工作方式」,让帮助程序员更加快乐高效地编程!