• 售前

  • 售后

热门帖子
入门百科

详解CocosCreator优化之DrawCall

[复制链接]
維健_廣律 显示全部楼层 发表于 2021-10-26 12:52:35 |阅读模式 打印 上一主题 下一主题
目录


  • 前言
  • 什么是 DrawCall
  • DrawCall 是怎样影响性能的呢?
  • 怎样淘汰 DrawCall

    • 针对图片资源
    • 针对 Label
    • 必经之路–调解UI层级次序

  • 总结

前言

在游戏开发中,DrawCall 作为一个非常紧张的性能指标,直接影响游戏的整体性能体现。
无论是 Cocos Creator、Unity、Unreal 照旧其他游戏引擎,只要说到游戏性能优化,DrawCall 都是绝对少不了的一项。
本文将会先容什么是 DrawCall,为什么要淘汰 DrawCall 以及在 Cocos Creator 项目中怎样淘汰 DrawCall 来提升游戏性能。

什么是 DrawCall

DrawCall就是CPU调用图形库(好比DirectX或OpenGL)的图形绘制接口,来命令GPU举行渲染的操纵。

DrawCall 是怎样影响性能的呢?

先举个栗子:
http情势从服务器拉取1024个巨细1kb的文件和单个巨细为1M的文件,哪个耗时更短?
答:肯定是拉取单个1M的更快。
原因就是每个请求之前,http 都必要做许多的准备工作来保证文件可以大概正常传输。而正是这些额外工作,造成了许多时间和性能开销。
而每一次绘制CPU都要调用DrawCall,而在调动DrawCall前,CPU还要举行许多准备工作:检测渲染状态、提交渲染所必要的数据、提交渲染所必要的状态。
而GPU本身具有很强大的盘算能力,可以很快就处理完渲染使命。一般来说,绘制 100 个三角形和绘制 1000 个三角形所消耗的时间没差多少。
但是,当 DrawCall 过多,CPU就会许多额外开销用于准备工作,CPU本身负载,而这时GPU大概闲置了。
**也就是说,正是因为每次渲染前,CPU 都必要做一系列准备工作,而 CPU 的每一次内存显存读写、数据处理和渲染状态切换都会带来肯定的性能和时间消耗,积少成多,而 GPU 大部门时间都在摸鱼。
以是才造成了我们认知中的,DrawCall 数目过多导致了卡顿 **

怎样淘汰 DrawCall

如上所说,我们可以通过一次多给 CPU 分配点工作,让一次渲染的内容多一些,淘汰分配次数,来到达我们的目标。
话是这么说,可是我们应该怎么现实操纵呢?往下看

针对图片资源

静态合图
就是讲碎图整合成一张大图,即我们常说的 打图集。
但是图集也不是随便打的,并不是一张大图容纳越多的碎图越好。这里面也是有肯定的门道的。
  1. <strong>尽量将处于同一界面(UI)下的相邻且渲染状态相同的碎图打包成图集</strong>
复制代码
  1. 对于Creator来说,在游戏运行时引擎是按照节点层级顺序从上往下由浅到深进行渲染的,理论上 每渲染一张图像(文本最终也是图像)都需要一次 DrawCall。
  2. 渲染状态是指:纹理状态(预乘、循环模式和过滤模式)或 Material(材质)、Blend(混合模式)等等,所以使用自定义 Shader 也会打断合批
复制代码
以是 相邻且渲染状态雷同 是关键点。
tip: 不建议任何图片资源的尺寸凌驾2048*2048,否则大概会出现加载相干的标题。
下面先容2种打图集的方式
主动图集资源(Auto Atlas)
利用 Cocos Creator 内置的主动图集资源来将碎图打包成图集。
在项目构建时,编辑器会将全部主动图集资源地点文件夹下的全部符合要求的图像分别根据配置打包成一个或多个图集。
主动图集资源使用起来很机动,编辑器在打包图集时会主动递归子目录,若子目录下也有主动图集资源(即 .pac 文件)则会跳过该目录,以是我们可以对同一目录下的差别部门的碎图配置差别的参数。
  1. 关于自动图集的几点建议
  2. 合理控制图集最大尺寸,避免单个图像加载时间过长。尺寸太大的图像没有必要打进图集(如背景图)。善用九宫格(Sliced)可以节省很多空间(这一点需要美术大佬配合)。间距保持默认的 2 并保持勾选扩边选项,避免图像裁剪错误和出现黑边的情况。勾选不包含未被引用资源选项,自动排除没有用到的图像以节省空间(该选项预览时无效)。开发时预览图集,根据结果进行调整,以达到最好的优化效果。
复制代码
TexturePacker
  1. 使用 TexturePacker 打包图集时需要注意配置「形状填充(Shape Padding,对应 Auto Atlas 中的间距)」,避免某张图像出现相邻图像的像素的情况。
复制代码
对比一下
Auto Atlas
       
  • Cocos Creator 内置,方便   
  • 功能不多但是该有的都有   
  • 项目构建时才天生图集,开发时恣意修改无压力   
  • 图集尺寸在天生时自适应,节省空间   
  • 支持主动纹理压缩
TexturePacker
       
  • 第三方软件需自行安装,不敷方便   
  • 收费功能许多很专业但是根本用不着,免费功能也够用   
  • 老师成图集再使用,更换图像又要重新天生图集   
  • 尺寸固定必要本身设置   
  • 不支持主动纹理压缩 动态合图
Creator 官方阐明:
  1. Cocos Creator 提供了在项目构建时的静态合图方法 —— 「自动合图」(Auto Atlas)。但是当项目日益壮大的时候贴图会变得非常多,很难将贴图打包到一张大贴图中,这时静态合图就比较难以满足降低 DrawCall 的需求。
  2. 所以 Cocos Creator 在 v2.0 中加入了 「动态合图」(Dynamic Atlas)的功能,它能在项目运行时动态的将贴图合并到一张大贴图中。当渲染一张贴图的时候,动态合图系统会自动检测这张贴图是否已经被合并到了图集(图片集合)中,如果没有,并且此贴图又符合动态合图的条件,就会将此贴图合并到图集中。
  3. 动态合图官方文档:
  4. https://docs.cocos.com/creator/manual/zh/advanced-topics/dynamic-atlas.html
复制代码
动态图集有2个限制:
       
  • 动态图集尺寸最大是 2048 * 2048   
  • 碎图的尺寸默认不能凌驾 512,可通过 API 举行修改:
    1. cc.dynamicAtlasManager.maxFrameSize = 512
    复制代码
tips: 启用动态合图会增大内存消耗,差别平台占用内存不一致。小游戏和原生平台默认禁止动态合图。可以通过 api 自行开启:
  1. cc.macro.CLEANUP_IMAGE_CACHE = false; cc.dynamicAtlasManager.enabled = true;
复制代码
还必要保证纹理的 Premulyiply Alpha(预乘)、Wrap Mode(循环模式) 和 Filter Mode(过滤模式) 等信息与动态图集一致才可以大概动态合批。
别的,静态图集也能参与动态合图,只要满足动态合图的要求即可。
tip1: 主动图集资源(Auto Atlas)必要在其属性查抄器面板中开启 Texture 栏下的 Packable 选项,该选项默认是禁用的
tip2: 精灵(Sprite)也是必要开启 Packable 选项才能动态合图。该选项默认是开启的
tip3: 如果要使用了 shader ,那么必要禁用该精灵的 Packable 选项。

针对 Label

位图字体(BMFont)
在 Creator 中使用体系字体或 TTF 字体的 Label 会打断渲染合批,特殊是 Label 和 Sprite 层叠交织的情况,每一个 Label 都会打断合批增长一个 DrawCall。
  1. 因此建议使用 BMFont 来代替 TTF 或系统字体,并且将 BMFont 与 UI 碎图打包到同一图集中(或「开启动态合图」),可以免除大部分文本导致的 DrawCall增加。
复制代码
文本缓存模式(Cache Mode)
Creator 2.0.9 版本在 Label 组件上增长了 Cache Mode 选项,来办理体系字体和 TTF 字体带来的性能标题。
CacheMode有三种选项:
       
  • NONE(默认) 每一个 Label 都会天生为一张单独的位图,且不会参与动态合图,以是每一个 Label 都会打断渲染合批   
  • BITMAP 开启 BITMAP 模式后,文本同样会天生为一张位图,但是只要符合动态合图要求就可以参与动态合图,和四周的精灵归并 DrawCall 。肯定要注意 BITMAP 模式只实用于不频仍更改的文本,否则内存会爆炸。   
  • CHAR 开启 CHAR 模式后,引擎会将该 Label 中出现的全部字符缓存到一张全局共享的位图中,相称于是天生了一个 BMFont 。实用于文本频仍更改的情况,对性能和内存最友好。tip: 该模式 只能用于字体样式和字号固定,而且不会频仍出现巨量未使用过的字符 的 Label。因为共享位图的最大尺寸为 2048*2048,占满了之后就没办法再渲染新的字符,必要切换场景才会扫除共享位图。
总结:对于大量频仍更改的文本,使用 CHAR 模式带来的性能提升优劣常明显的。
同时 CHAR 模式的局限也很明显,一般用于场景中出现大量数字文本,雷同于经验值增长、血量淘汰之类的殊效的情况

必经之路–调解UI层级次序
  1. 原则:
  2. 分离图像节点和文本节点文本使用 BMFont 或 Cache Mode 选项,尽量出现避免文本打断渲染合批的情况FBI WARNING: 一个 Mask 组件及其控制的渲染节点,需要至少三次 Draw call。第一次开启模板测试并调用一次 Draw call,刷新模板缓冲。第二次绘制对需要通过模板测试的区域进行设置。第三次再进行实际的子节点内容绘制,绘制结束再关闭模板测试。因此 <strong>使用 Mask 组件就无法与其他相邻节点进行批次处理</strong> ,但是 Mask 组件内部的连续节点在满足合并规则的情况下还是会进行合批。
复制代码
总结

改变渲染状态会打断渲染合批,比方改变纹理状态(预乘、循环模式和过滤模式)或改变 Material(材质)、Blend(混淆模式)等等,以是使用自界说 Shader 也会打断合批。图集默认不参与动态合图,手动开启主动图集资源的 Packable 选项后如果最终图集符合动态合图要求也可以参与动态合图。纹理开启 Packable 选项参与动态合图后无法使用自界说 Shader,因为动态合图会修改原始贴图的 UV 坐标。使用 Cache Mode 的 BITMAP 模式必要注意内存情况,CHAR 模式必要注意文本内容不宜过多。在 ***Cocos Creator 2.0.7 之前的版本***中,改背叛点的颜色或透明度、Sprite 组件使用九宫格(Sliced)都会打断渲染合批
以上就是详解CocosCreator优化之DrawCall的详细内容,更多关于CocosCreator优化DrawCall的资料请关注草根技术分享其它相干文章!

帖子地址: 

回复

使用道具 举报

分享
推广
火星云矿 | 预约S19Pro,享500抵1000!
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

草根技术分享(草根吧)是全球知名中文IT技术交流平台,创建于2021年,包含原创博客、精品问答、职业培训、技术社区、资源下载等产品服务,提供原创、优质、完整内容的专业IT技术开发社区。
  • 官方手机版

  • 微信公众号

  • 商务合作