35

深入理解PHP7内核之FAST_ZPP

 4 years ago
source link: https://www.laruence.com/2020/02/27/5213.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

从PHP7开始,大家可能会发现,不少函数不再使用传统的参数处理方式,而是改用了我们称之为Fast zend parameters parsing(FAST_ZPP)的新型方式, 比如在PHP7之前,count函数是这样的:

PHP_FUNCTION(count)
{
    zval *array;
    long mode = COUNT_NORMAL;

    if (zend_parse_parameters(ZEND_NUM_ARGS() TSRMLS_CC, "z|l", &array, &mode) == FAILURE) {
        return;
    }
    ....
}

在PHP7以后,变成了:

PHP_FUNCTION(count)
{
    zval *array;
    zend_long mode = COUNT_NORMAL;

    ZEND_PARSE_PARAMETERS_START(1, 2)
       
        Z_PARAM_OPTIONAL
        Z_PARAM_LONG(mode)
    ZEND_PARSE_PARAMETERS_END();
    ...
}

很多PHP扩展开发的同学可能在初次接触的时候,会觉得很陌生,不要焦虑,让我慢慢道来 :)

当时在做PHPNG(PHP7的开发项目代号)的开发的时候,我们主要的发现性能提升点的一个方式就是bench各种大型实际项目,来发现占用资源比较大的部分,而最常用benchmark对象之一是wordpress,因为它够复杂,够慢,(它也是我们开发JIT的时候对主要bench目标:)) 代表了非OO型代码类的典型应用, 在实际的benchmark的过程中我们发现,将近有6%的耗时被zend_parse_parameters给占用了。

事实上zend_parameters_parsing确实是一个很庞大的函数:

ZEND_API int zend_parse_parameters(int num_args, const char *type_spec, ...)

它根据type_spec字符串中指定的标识符,来处理输入参数,而这个参数符有很多种(具体含义可以参看: README.PARAMETER_PARSING_API ):

a A b C d f h H l L o O p P r s S z * + | / !

根据不通的组合来表示我们的PHP函数要接受的参数类型,比如例子中的count, 申明要接受一个zval类型的参数,和一个可选的long类型的mode参数,当zend_parse_parameters在runtime的时候被调用的时候,就会需要分析这些字符,然后调用对应的逻辑,对于一些本身就很简单的函数来说,比如count,这个开销就会显得很明显。

  再回头来看这个函数的特点,我们会发现,比如对于count这个例子来说,其实type_spec在编译期就是确定的常量,也就是说,其实在编译的时候,我们就应该已经知道了”a|l”应该调用那些对应的参数处理逻辑。

而事实上,当代的编译器都具备这个能力, 比如对于如下的代码:

#include <stdlib.h>

#define AAA  1;
int main() {
    int a = AAA;
    if (a) {
        abort();
    }
    return 0;
}

如果我们尝试让编译优化(-o2)它,并检查生成的汇编:

main:
.LFB18:
    subq    $8, %rsp
    call    abort@PLT

大家可以看到,if判断已经被抹掉了, 因为在编译时刻, 就能知道a是1, if一定为真。

而FAST_ZPP就是充分借助了这个能力而来的一种新型的参数申明方式, 比如对于Z_PARAM_ZVAL(array)

#define Z_PARAM_ZVAL_EX(dest, check_null, separate) \
        if (separate) { \
            Z_PARAM_PROLOGUE(separate); \
            zend_parse_arg_zval_deref(_arg, &dest, check_null); \
        } else { \
            ++_i; \
            ZEND_ASSERT(_i <= _min_num_args || _optional==1); \
            ZEND_ASSERT(_i >  _min_num_args || _optional==0); \
            if (_optional && UNEXPECTED(_i >_num_args)) break; \
            _real_arg++; \
            zend_parse_arg_zval(_real_arg, &dest, check_null); \
        }

#define Z_PARAM_ZVAL(dest) \
    Z_PARAM_ZVAL_EX(dest, 0, 0)

在编译时刻就能被先替换为:

zend_parse_arg_zval(((zval*)execute_data) - 1, &array, 0);

而如果我们进一步审视zend_parse_arg_zval:

static zend_always_inline void zend_parse_arg_zval(zval *arg, zval **dest, int check_null)
{
    *dest = (check_null &&
        (UNEXPECTED(Z_TYPE_P(arg) == IS_NULL) ||
         (UNEXPECTED(Z_ISREF_P(arg)) &&
          UNEXPECTED(Z_TYPE_P(Z_REFVAL_P(arg)) == IS_NULL)))) ? NULL : arg;
}

我们会发现它也是一个inline申明的函数,而参数因为是常量,那么就可以进一步被evaluate成:

zval *array = ((zval*)execute_data) - 1;

怎么样,是不是一看就知道会快很多? 没有type_spec分析,没有额外的函数调用,直接获取到参数。

而刚刚的inline函数的编译时期根据常数的内联也是被PHP7中大量使用,来避免重复代码的,有兴趣的可以参看zend_hash.c中的很多相似函数的定义。

当然,这么做也有一个问题就是, 会增大我们程序的binary size, 这个也很容易理解, 比如对于count来说,本来原来只是调用一个外部函数,一个call指令就够了,但先就会有很多内联进来的指令。

而binary size变大以后,执行时期的cache miss就会增大,也会影响性能,所以FAST_ZPP我们也不是建议全部使用, 而真是针对实际应用中调用频率比较大,并且本身函数逻辑较为简单的函数来使用.

总结一下,一般来说,我们自己写的扩展函数,并不需要一定使用FAST_ZPP, 因为如果自身是复杂的函数逻辑的, 这点开销对比起来,其实也好好了。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK