跳转到主要内容

Perl性能优化的三个技巧

本文和大家重点讨论一下Perl性能优化技巧,利用Perl开发一些服务应用时,有时会遇到Perl性能或资源占用的问题,可以巧用require装载模块,使用系统函数及XS化模块,自写低开销模块等来优化Perl性能。

Perl性能优化

Perl是强大的语言,是强大的工具,也是一道非常有味道的菜:-)利用很多perl的特性,可以实现一些非常有趣而实用的功能。

利用Perl开发一些服务应用时,有时会遇到Perl性能或资源占用的问题,如何解决呢?以下是自己过去开发实践的一些经验,几个主要的技巧分别是:

◆巧用require装载模块
◆使用系统函数及XS化模块
◆自写低开销模块
◆优化正则表达式
◆善用BSDsocket

巧用require装载模块

为避免程序一启动就加载大量模块,降低启动速度,可以在必要的时候再装载模块,这时候就是require大派用场的时候了。如:

#!/usr/bin/perl-w  
usepre_load_module;  
 
#Initializesomething  
init_args();  
 
#if$use_this_moduleistrue,loadtheModule  
if($use_this_module){  
	requireModule;  
}  

上述代码中,如果变量$use_this_module设置了,那么才加载Module,如果没设置则不需要加载,实现了:useondemand的功能。在CGI应用程序中,这相当有用,如果每次请求(fork)都加载大量无用模块的话,响应速度会有所降低,而在特定场合才加载一些模块将加块启动、解析的速度,提高Perl性能。

再看一个例子:

#!/usr/bin/perl  
my$pid=forkordie"can'tfork:$!\n";  
if($pid){  
	print"i'mfather\n";  
	sleep;  
}else{  
	print"i'mchild\n":  
	requireIO::Socket;  
	sleep;  
} 

上述代码中,如果在程序一开始就用use来载入IO::Socket模块,那么子/父进程都加载了该模块,通过top命令发现子父进程大小都是3.07MB;如果只在子进程里加载,则只在子进程里有效,内存的消耗将降低,top命令发现子进程3.04MB,父进程变为1.4MB。

使用系统函数及XS化模块

Perl内建的系统函数及用c编写的perlXS扩展模块的速度和效率都比纯perl的实现要好得多。在Perl性能要求较高的场合(如开发ApplicationServer,NetworkServer等),可以考虑使用这些内建函数或XS化模块。

如Socket就比IO::Socket的内存消耗要低,XS编写的Data::Dumper就比纯Perl的Data::Dumper要快4-5倍。
此外,一些简单的任务并没必要使用Perl模块,如获得主机IP地址就大可不必载入庞大的Net::DNS而只是使用gethostbyname()系统函数即可。

以下是一些常用的替代方案以获得更快的速度,更好的效率:

◆用sys*系列函数等替代open/seek/tell/<>等标准IO操作
◆用Socket代替IO::Socket以获得更低开销和内存占用
◆用get*by*系列函数代替Net::DNS
◆用index/substr等代替部分低效正则表达式
◆用select(3参数版本)代替IO::Handle部分功能.......

自写低开销模块

通常我们使用一些Perl模块时,只使用了其中很小一部分的功能,可是却不得不载入整个模块,甚至要载入其他不相关的模块。因此往往使整个程序非常臃肿庞大。
著名的web管理软件webmin的miniserv(一个简化的http服务端)功能强大,还支持SSL,但资源占用却出奇的少,只有大约5.6MB的大小!这是为什么呢?因为miniserver只使用了2个Perl系统模块(Socket及POSIX),没有载入其他的模块。一些本需要其他perl模块的功能,均由web-lib.pl等用系统函数编写代替。

例如以下是一个获得A记录的高速函数get_mx(),它不依赖任何模块,速度非常快,可以提高Perl性能。

subget_mx{  
	my@info=gethostbynameshift;  
	my@addr=splice(@info,4);  
	my@rt;  
	foreach(@addr){  
		push@rt,join('.',unpack('C4',$_));  
	}  
	\@rt;  
} 

另一个例子,对于标准的IO::Handle对象,可以使用$obj->autoflush(1);来设置缓冲的特性,我们通过使用系统函数select()来获得同样的能力,而无需要载入IO::Handle,代码如下:

subautoflush{  
	my$io=$_[0];  
	select((select($io),$|=1)[0]);  
}