• 售前

  • 售后

热门帖子
入门百科

PHP序列化的四种实现方法与横向对比

[复制链接]
落日五湖W 显示全部楼层 发表于 2021-10-26 12:29:32 |阅读模式 打印 上一主题 下一主题
一、PHP 序列化变量的 4 种方法
序列化是将变量转换为可保存或传输的字符串的过程;反序列化就是在适当的时间把这个字符串再转化成原来的变量使用。这两个过程联合起来,可以轻松地存储和传输数据,使步伐更具维护性。
1. serialize和unserialize函数
这两个是序列化和反序列化PHP中数据的常用函数。
  1. $a = array('a' => 'Apple' ,'b' => 'banana' , 'c' => 'Coconut');
  2. //序列化数组
  3. $s = serialize($a);
  4. echo $s;
  5. //输出结果:a:3:{s:1:"a";s:5:"Apple";s:1:"b";s:6:"banana";s:1:"c";s:7:"Coconut";}
  6. echo '<br /><br />';
  7. //反序列化
  8. $o = unserialize($s);
  9. print_r($o);
复制代码
当数组值包罗如双引号、单引号或冒号等字符时,它们被反序列化后,大概会出现问题。为了克服这个问题,一个巧妙的本领是使用base64_encode和base64_decode。
  1. $obj = array();
  2. //序列化
  3. $s = base64_encode(serialize($obj));
  4. //反序列化
  5. $original = unserialize(base64_decode($s));
复制代码
但是base64编码将增长字符串的长度。为了克服这个问题,可以和gzcompress一起使用。
  1. //定义一个用来序列化对象的函数
  2. function my_serialize( $obj )
  3. {
  4.   return base64_encode(gzcompress(serialize($obj)));
  5. }
  6. //反序列化
  7. function my_unserialize($txt)
  8. {
  9.   return unserialize(gzuncompress(base64_decode($txt)));
  10. }
复制代码
2. json_encode 和 json_decode
使用JSON格式序列化和反序列化是一个不错的选择:
      
  • 使用json_encode和json_decode格式输出要serialize和unserialize格式快得多。  
  • JSON格式是可读的。  
  • JSON格式比serialize返回数据结果小。  
  • JSON格式是开放的、可移植的。其他语言也可以使用它。
  1. $a = array('a' => 'Apple' ,'b' => 'banana' , 'c' => 'Coconut');
  2. //序列化数组
  3. $s = json_encode($a);
  4. echo $s;
  5. //输出结果:{"a":"Apple","b":"banana","c":"Coconut"}
  6. echo '<br /><br />';
  7. //反序列化
  8. $o = json_decode($s);
复制代码
在上面的例子中,json_encode输出长度比上个例子中serialize输出长度显然要短。
3. var_export 和 eval
var_export 函数把变量作为一个字符串输出;eval把字符串当成PHP代码来实行,反序列化得到最初变量的内容。
  1. $a = array('a' => 'Apple' ,'b' => 'banana' , 'c' => 'Coconut');
  2. //序列化数组
  3. $s = var_export($a , true);
  4. echo $s;
  5. //输出结果: array ( 'a' => 'Apple', 'b' => 'banana', 'c' => 'Coconut', )
  6. echo '<br /><br />';
  7. //反序列化
  8. eval('$my_var=' . $s . ';');
  9. print_r($my_var);
复制代码
4. wddx_serialize_value 和 wddx deserialize
wddx_serialize_value函数可以序列化数组变量,并以XML字符串情势输出。
  1. $a = array('a' => 'Apple' ,'b' => 'banana' , 'c' => 'Coconut');
  2. //序列化数组
  3. $s = wddx_serialize_value($a);
  4. echo $s;
  5. //输出结果(查看输出字符串的源码):<wddxPacket version='1.0'><header/><data><struct><var name='a'><string>Apple</string></var><var name='b'><string>banana</string></var><var name='c'><string>Coconut</string></var></struct></data></wddxPacket>
  6. echo '<br /><br />';
  7. //反序列化
  8. $o = wddx_deserialize($s);
  9. print_r($o);
  10. //输出结果:Array ( [a] => Apple [b] => banana 1 => Coconut )
复制代码
可以看出,XML标具名符较多,导致这种格式的序列化照旧占了很多空间。
结论
上述所有的函数在序列化数组变量时都能正常实行,但运用到对象就不同了。比方json_encode序列化对象就会失败。反序列化对象时,unserialize和eval将有不同的结果。
英文原文:3 ways to serialize variables in php
二、PHP四种序列化方案横向对比
数据的序列化是一个非常有效的功能,然而目测很多人跟我一样,在刚打仗这玩意的时间压根就不明白这货色到底是干啥用的,反正老师说了,实在明白不了就先背过再说。
实在将数据序列化的作用无外乎有两个:
      
  • 方便传输  
  • 方便存储
方便存储怎样明白呢?比如我们有个PHP对象或者一个PHP数组必要存储到数据库乃至文件中,这显然是不大概的,这个时间必须要将PHP对象或者PHP数组序列化后再实行存储操纵。不外这将PHP数组序列化后存起来还能明白,这对象也能存储啊?这操纵是否过于风骚?少年,这一点儿都不风骚。有些时间将对象直接存储起来,用的时间只必要简单的反序列化后就可以投产使用了,避免了new一次带来的性能耗费。
方便传输怎样明白呢?实在序列化在传输中应用的相对更多更常见些许。最简单的一个例子,一个码前端的码了一个ajax找你给TA提供一个API,那么这个时间你俩得商量返回什么数据,比如json或者xml,乃至你俩自己作死约定私有数据格式。比如在一个比较典型的服务架构中,网关服务器和内部RPC服务器之间通过msgpack通报数据。这都是典型的序列化为了传输的典型应用案例。
这里序列化的概念大概更为广泛和笼同一些,包括传统的serialize、json、msgpack、protobuf等。( 假如你觉得序列化这个称呼不太严谨的话,可以用encode来取代;反序列化则用decode来取代。反正我就用统统用序列化和反序列化来称呼了,假如你觉得实在不舒服,可以顺着网线来砍我!)。
现实上,从更高的层面看,数据的序列化可以分为两种:
      
  • 文本序列化,常见如json、serialize、xml等  
  • 二进制序列化,常见如msgpack、protobuf、thrift等
一样平常说来,考验序列化技术的性能指标一共有两个,一个是序列化的速度,一个是序列化后数据的巨细,天然是序列化速度越快、序列化后的数据越小为佳。就目前来看,protobuf、msgpack等二进制序列化无论是速度上照旧数据巨细上,都要比文本序列化更好。不外话说返来,文本序列化有更好的可读性,一眼就能瞪出来数据内容大概是啥玩意。
本日带到这里的这里的有四个具体的方案,这四种方案都是简单粗暴、开箱即用类型的,我们分别测试感受下,看哪个更得当我们。
参会的四个哥们:PHP内置的serialize、PHP内置的JSON分析器、PHP扩展JSOND、PHP扩展msgpack。此中前三个都是文本类型的,msgpack则是二进制类型的。
JSOND作为PHP内置的JSON分析器的高级版本,坊间一直听说速度上要比内置的更牛X一些,作为扩展,这货必要额外安装,附送地点:https://pecl.php.net/get/jsond-1.4.0.tgz。
msgpack是一个鸟哥等人搞的一套二进制序列化工具,slogan就是“It's like JSON.but fast and small.”,附送地点:https://pecl.php.net/get/msgpack-2.0.2.tgz

1、serialize用法
serialize(),序列化方法。
unserialize(),反序列化方法。
2、json用法
json_encode(),没啥好说的吧?
json_decode(),没啥好说的吧?
3、jsond用法
jsond_encode(),和json_encode()一样,反面多个字母d而已。
jsond_decode(),和json_decode()一样,反面多个字母d而已。
4、msgpack用法
msgpack_pack(),序列化方法。
msgpack_unpack(),反序列化方法。
测试代码如下:
  1. <?php
  2. // 故意搞了一个还算大的php数组,更容易看出差距来
  3. $arr = array(
  4. array(
  5. 'uid' => 22193123,
  6. 'gender' => 'famale',
  7. 'username' => 'elarity',
  8. 'password' => md5('www123'),
  9. 'relation' => array(
  10. array(
  11. 'uid' => 22193123,
  12. 'gender' => 'famale',
  13. 'username' => 'elarity',
  14. 'password' => md5('www123'),
  15. ),
  16. array(
  17. 'uid' => 22193123,
  18. 'gender' => 'famale',
  19. 'username' => 'elarity',
  20. 'password' => md5('www123'),
  21. ),
  22. array(
  23. 'uid' => 22193123,
  24. 'gender' => 'famale',
  25. 'username' => 'elarity',
  26. 'password' => md5('www123'),
  27. ),
  28. array(
  29. 'uid' => 22193123,
  30. 'gender' => 'famale',
  31. 'username' => 'elarity',
  32. 'password' => md5('www123'),
  33. ),
  34. array(
  35. 'uid' => 22193123,
  36. 'gender' => 'famale',
  37. 'username' => 'elarity',
  38. 'password' => md5('www123'),
  39. ),
  40. array(
  41. 'uid' => 22193123,
  42. 'gender' => 'famale',
  43. 'username' => 'elarity',
  44. 'password' => md5('www123'),
  45. ),
  46. array(
  47. 'uid' => 22193123,
  48. 'gender' => 'famale',
  49. 'username' => 'elarity',
  50. 'password' => md5('www123'),
  51. ),
  52. array(
  53. 'uid' => 22193123,
  54. 'gender' => 'famale',
  55. 'username' => 'elarity',
  56. 'password' => md5('www123'),
  57. ),
  58. array(
  59. 'uid' => 22193123,
  60. 'gender' => 'famale',
  61. 'username' => 'elarity',
  62. 'password' => md5('www123'),
  63. ),
  64. ),
  65. )
  66. );
  67. // 每种序列化方案都执行100000次
  68. $counter = 100000;
  69. // json序列化方案,执行100000次
  70. echo PHP_EOL.PHP_EOL;
  71. $start = microtime( true );
  72. for( $i = 1; $i <= $counter; $i++ ){
  73. $json = json_encode( $arr );
  74. }
  75. $size = strlen( $json );
  76. $end = microtime( true );
  77. $cost_time = $end - $start;
  78. echo "json_encode : 耗费时间为{$cost_time} , 数据体积为{$size}".PHP_EOL;
  79. // jsond序列化方案,执行100000次
  80. $start = microtime( true );
  81. for( $i = 1; $i <= $counter; $i++ ){
  82. $jsond = jsond_encode( $arr );
  83. }
  84. $size = strlen( $jsond );
  85. $end = microtime( true );
  86. $cost_time = $end - $start;
  87. echo "jsond_encode : 耗费时间为{$cost_time} , 数据体积为{$size}".PHP_EOL;
  88. // serialize序列化方案,执行100000次
  89. $start = microtime( true );
  90. for( $i = 1; $i <= $counter; $i++ ){
  91. $serialize = serialize( $arr );
  92. }
  93. $size = strlen( $serialize );
  94. $end = microtime( true );
  95. $cost_time = $end - $start;
  96. echo "serialize : 耗费时间为{$cost_time} , 数据体积为{$size}".PHP_EOL;
  97. // msgpack序列化方案,执行100000次
  98. $start = microtime( true );
  99. for( $i = 1; $i <= $counter; $i++ ){
  100. $msgpack = msgpack_pack( $arr );
  101. }
  102. $size = strlen( $msgpack );
  103. $end = microtime( true );
  104. $cost_time = $end - $start;
  105. echo "msgpack耗费时间为 : {$cost_time} , 数据体积为{$size}".PHP_EOL;
  106. echo PHP_EOL.PHP_EOL;
复制代码
将文件保存为test.php,然后php test.php实行,结果如下图所示:

总结一下:
      
  • jsond确实是要比json快一些的  
  • 总有刁民张嘴就来json要比serialize()快  
  • serialize()数据体积确实大(由于还保留了数据类型说明)  
  • msgpack最佳???不知道昂,你们自己感受

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x

帖子地址: 

回复

使用道具 举报

分享
推广
火星云矿 | 预约S19Pro,享500抵1000!
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

草根技术分享(草根吧)是全球知名中文IT技术交流平台,创建于2021年,包含原创博客、精品问答、职业培训、技术社区、资源下载等产品服务,提供原创、优质、完整内容的专业IT技术开发社区。
  • 官方手机版

  • 微信公众号

  • 商务合作