乐者为王

Do one thing, and do it well.

我是如何让Ruby脚本速度提升156倍的

以前写过使用Ruby批量修改繁体文件名为简体,可惜脚本的性能很有问题,批量重命名时运行速度非常慢。这次准备优化下代码,提升脚本的执行效率。

profile.rb是为Ruby程序准备的profiler,它可以统计并输出各方法的运行时间,以便于找到程序执行的性能瓶颈。这次就用它来剖析脚本的运行时间。使用方法很简单,加上命令行选项-r profile就可以:

1
ruby -r profile rename.rb

运行结束后,会把统计信息输出到标准错误输出中。如下图所示:

profile统计的是各方法的运行时间,分为两类。一类是计算的是从方法调用到方法返回之间的时间,称为整体时间;另一类则是从整体时间中扣除在该方法中调用其它方法所耗费时间之后得到的时间,称为实际时间。

上图输出信息每行中各字段含义如下(从左到右):

  • 该方法执行时间占整体时间的百分比,比例越高越说明这行代码可能需要优化
  • 整体时间的总和
  • 实际时间的总和
  • 被调用的次数
  • 每次调用的平均实际时间(毫秒)
  • 每次调用的平均整体时间(毫秒)
  • 方法名

由上图可以看出,脚本执行的时间大部分耗在了循环上。解决方法有两个:消除循环或减少循环次数。前者很难实现,暂且还没有想到办法,也许根本就没有可能。脚本中mapping的大小为2685,所以每修改一个文件名需要执行2685次循环,且循环中的encode和gsub!都是耗时操作。通常文件名的长度不超过30个字符,通过遍历文件名中每个字符的方式重命名就可以把循环次数缩减到不超过30次。

修改代码后重新执行分析命令,得到的结果是脚本运行时间从379395秒变成2418秒,性能整整提升了156倍,达到2个数量级的效果。

Comments