Arclin

Advocate Technology. Enjoy Technology.

0%

iOS --- 性能优化

本文主要介绍iOS内常用的性能优化方案

CPU和GPU

  • 在屏幕成像的过程中,CPU和GPU起着至关重要的作用

    • CPU
      • 对象的创建和销毁,对象属性的调整、布局计算、文本的计算和排版、图片格式转换和解码、图像的绘制
    • GPU
      • 纹理的渲染
  • 在iOS中是双缓冲机制,有前帧缓存、后帧缓存()

1
CPU->计算->GPU->渲染->帧缓存->读取->视频控制器->显示->屏幕   

屏幕成像原理

首先先发出一个垂直同步信号(VSync),然后再一行行发出水平同步信号(HSync),直到最后一行HSync发出之后,一帧就渲染完成,然后再次发出一个VSync,渲染下一帧。

卡顿

卡顿产生的原因

1682758-5be402cc0ab5dc56.png

  1. 首先第一个VSync进入,CPU开始计算处理,然后交给GPU渲染,然后显示到屏幕上
  2. 然后第二个VSync进入,这时候CPU处理的时间比较长,交给GPU后, GPU还没处理完,第三个VSync就进来了,但是因为GPU没处理完。第二帧还不能显示,所以这时候直接取上一帧数据显示,造成第一帧长时间停留
  3. 然后过了一段时间GPU终于处理完了,但是第四个VSync还没来,所以就等,等到第四个VSync进来了,就开始拿刚才生成好的那一帧去显示,然后开始继续第三帧的计算
  • 解决卡顿的主要思路
    • 尽可能减少CPU、GPU资源损耗
  • 按照60fps的刷新率,每个16ms就会有一次VSync信号

卡顿检测

  • 平时所说的__卡顿__主要是因为在主线程执行了比较耗时的操作
  • 可以添加Observer到主线程Runloop中,通过监听Runloop状态切换的耗时,以达到监控卡顿的目的

参考:LXDAppFluecyMonitor

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
static void lxdRunLoopObserverCallback(CFRunLoopObserverRef observer, CFRunLoopActivity activity, void * info) {
/// 更新当前Runloop状态
SHAREDMONITOR.currentActivity = activity;
dispatch_semaphore_signal(SHAREDMONITOR.semphore);
};

- (void)startMonitoring {
if (_isMonitoring) { return; }
_isMonitoring = YES;
CFRunLoopObserverContext context = {
0,
(__bridge void *)self,
NULL,
NULL
};
/// 创建监听对象
_observer = CFRunLoopObserverCreate(kCFAllocatorDefault, kCFRunLoopAllActivities, YES, 0, &lxdRunLoopObserverCallback, &context);
/// 在CommonModes添加监听者
CFRunLoopAddObserver(CFRunLoopGetMain(), _observer, kCFRunLoopCommonModes);

/// 子线程异步串行队列中添加死循环
dispatch_async(lxd_event_monitor_queue(), ^{
while (SHAREDMONITOR.isMonitoring) {
/// 如果当前状态是BeforeWaiting(即将进入休眠)的话
if (SHAREDMONITOR.currentActivity == kCFRunLoopBeforeWaiting) {
__block BOOL timeOut = YES;
dispatch_async(dispatch_get_main_queue(), ^{
timeOut = NO; // 即将休眠的时候回到主线程超时状态改为NO
dispatch_semaphore_signal(SHAREDMONITOR.eventSemphore); //解锁
});
[NSThread sleepForTimeInterval: lxd_time_out_interval]; // 子线程休眠一秒
if (timeOut) {
[LXDBacktraceLogger lxd_logMain]; // 打印堆栈
}
dispatch_wait(SHAREDMONITOR.eventSemphore, DISPATCH_TIME_FOREVER); // 加锁
}
}
});

dispatch_async(lxd_fluecy_monitor_queue(), ^{
while (SHAREDMONITOR.isMonitoring) {
long waitTime = dispatch_semaphore_wait(self.semphore, dispatch_time(DISPATCH_TIME_NOW, lxd_wait_interval)); // 等待200纳秒,看是否能拿到锁
if (waitTime != LXD_SEMPHORE_SUCCESS) { // 拿不到锁
if (!SHAREDMONITOR.observer) {
SHAREDMONITOR.timeOut = 0;
[SHAREDMONITOR stopMonitoring];
continue;
}
/// Runloop 即将处理Source或者刚从休眠中唤醒
if (SHAREDMONITOR.currentActivity == kCFRunLoopBeforeSources || SHAREDMONITOR.currentActivity == kCFRunLoopAfterWaiting) {
if (++SHAREDMONITOR.timeOut < 5) { // 超时次数+1,然后如果超时次数大于5次就打印堆栈
continue;
}
[LXDBacktraceLogger lxd_logMain];
[NSThread sleepForTimeInterval: lxd_restore_interval];
}
}
SHAREDMONITOR.timeOut = 0;
}
});
}

卡顿优化 - CPU

  • 尽量使用轻量级的对象,比如用不到事件处理的地方,可以考虑使用CALayer(只是拿来渲染)取代UIView(渲染+处理点击事件等)
  • 不要频繁地调用UIView的相关属性,比如frameboundstransform等属性,尽量减少不必要的修改
  • 尽量提前计算好布局,在有需要时一次性调整对应的属性,不要多次修改属性
  • Autolayout会比直接设置frame消耗更多的CPU资源
  • 图片的Size最好跟UIImageView的size保持一致
  • 控制一下线程的最大并发数量
  • 尽量把耗时操作放到子线程
    • 文本处理(尺寸计算、绘制)
    • 图片处理(解码、绘制)

图片子线程解码举例

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
- (void)renderImage {

dispatch_async(dispatch_get_global_queue(0, 0), ^{
/// get CGImage
CGImageRef cgImage = [UIImage imageWithData:[NSData dataWithContentsOfURL:xxx]].CGImage;

size_t width = CGImageGetWidth(cgImage);
size_t height = CGImageGetHeight(cgImage);
if (width == 0 || height == 0) return;

CGImageAlphaInfo alphaInfo = CGImageGetAlphaInfo(cgImage);
BOOL hasAlpha = !(alphaInfo == kCGImageAlphaNone ||
alphaInfo == kCGImageAlphaNoneSkipFirst ||
alphaInfo == kCGImageAlphaNoneSkipLast);


CGBitmapInfo bitmapInfo = kCGBitmapByteOrder32Host;
bitmapInfo |= hasAlpha ? kCGImageAlphaPremultipliedFirst : kCGImageAlphaNoneSkipFirst;
CGContextRef context = CGBitmapContextCreate(NULL, width, height, 8, 0, CGColorSpaceCreateDeviceRGB(), bitmapInfo);
if (!context) {
return;
}

// Apply transform
CGAffineTransform transform = CGAffineTransformIdentity;
CGContextConcatCTM(context, transform);
CGContextDrawImage(context, CGRectMake(0, 0, width, height), cgImage); // The rect is bounding box of CGImage, don't swap width & height
CGImageRef newImageRef = CGBitmapContextCreateImage(context);
CGContextRelease(context);

// back to the main thread
dispatch_async(dispatch_get_main_queue(), ^{
self.imageView.image = [[UIImage alloc] initWithCGImage:newImageRef];
CGImageRelease(newImageRef);
});
});
}

卡顿优化 - GPU

  • 尽量避免短时间内大量图片的显示,尽可能将多张图片合成一张进行显示
  • GPU能处理的最大纹理尺寸是4096*4096,一旦超过这个尺寸,就会占用CPU资源进行处理,所以纹理尽量不要超过这个尺寸
  • 尽量减少视图数量和层次
  • 减少透明的视图(alpha < 1),不透明的就设置opaqueYES
  • 尽量避免出现离屏渲染

离屏渲染

  • 在OpenGL中,GPU有2种渲染方式

    • On-Screen Rendering:当前离屏渲染,在当前用于显示屏幕缓冲区进行渲染操作
    • Off-Screen Rendering: 离屏渲染,在当前屏幕缓冲区以外开辟一个缓冲区进行渲染操作
  • 离屏渲染消耗性能的原因

    • 需要创建新的缓冲区
    • 离屏渲染的整个过程,需要多次切换上下文环境,先是从当前屏幕(On-Screen)切换到离屏(Off-Screen);等到离屏渲染结束以后,将离屏缓冲区的渲染结果显示到屏幕上,又需要将上下文环境从离屏切换到当前屏幕上。
  • 哪些操作会触发离屏渲染

    • 光栅化,layer.shouldRasterize = YES
    • 遮罩 layer.mask
    • 圆角,同时设置 layouer.maskToBounds = YES, layer.cornerRadius大于0
      • 考虑通过CoreGraphics绘制裁剪圆角,或者叫美工提供圆角图片
    • 阴影,layer.shadowXXX
      • 如果设置了layer.shadowPath就不会产生离屏渲染

耗电优化

主要来源

  • CPU处理,Processing
  • 网络,Networking
  • 定位,Location
  • 图像,Graphics

优化

  • 尽可能降低CPU、GPU功耗

  • 少用定时器

  • 优化I/O操作

    • 尽量不要频繁写入小数据,最好批量一次性写入
    • 读写大量重要数据时,考虑使用dispatch_io,其提供了基于GCD的异步操作文件的I/O的API.用dispatch_io系统会优化磁盘访问
    • 数据量比较大的,建议使用数据库(SQLite、CoreData)
  • 网络优化

    • 减少、压缩网络数据
    • 如果多次请求结果是相同的,尽量使用缓存
    • 使用断点续传,否则网络不稳定时可能多次传输相同的内容
    • 网络不可用时,不要尝试执行网络请求
    • 让用户可以取消长时间运行或者速度很慢的网络操作,设置合适的超时时间
    • 批量传输,比如,下载视频流时,不要传输很小的数据包,直接下载整个文件或者一大块一大块地下载,如果下载广告,一次性多下载一些,然后再慢慢展示,如果下载电子邮件,一次下载多封,不要一封一封地下载
  • 定位优化

    • 如果只是需要快速确定用户当前位置,最好用CLLocationManagerrequestLocation方法,定位完成后,会自动让定位硬件断电
    • 如果不是导航应用, 尽量不要实时更新位置,定位关闭就关掉定位服务
    • 尽量降低定位精度,比如尽量不要使用精度最高的kCLLocationAccuracyBest
    • 需要后台定位时,尽量设置pausesLocationUpdatesAutomatically为YES,如果用户不太可能移动的时候,系统会自动暂停位置更新
    • 尽量不要使用startMonitoringSignificantLocationChanges,优先考虑startMonitoringForRegion:
  • 硬件检测优化

    • 用户移动、摇晃、倾斜设备时,会产生动作(motion)事件,这些事件由加速度计、陀螺仪、磁力计等硬件检测。在不需要检测的场合,应该及时关闭这些硬件。

App启动优化

  • App的启动可以分为2种

    • 冷启动(Code Launch):从零开始启动App
    • 热启动(Warm Launch):App已经在内存中,在后台存活着,再次点击图标
  • App启动时间的优化,主要是针对冷启动进行优化

  • 通过添加环境变量可以打印出App的启动时间分析(Edit Scheme -> Run -> Arguments)

    • DYLD_PRINT_STATISTICS设置为1 或者 DYLD_PRINT_STATISTICS_DETAILS (更加详细 )
  • App的冷启动可以概括为3大阶段

    • dyld

    • runtime

    • main

    • dyld(dynamic link editor),Apple的动态链接器,可以用来装在Mach-O文件(可执行文件、动态库等 )

    • 启动App时,dyld所做的事情有

      • 装载App的可执行文件,同时会递归加载所有依赖的动态库
      • 当dyld把可执行文件、动态库都装载到内存完毕后,会通知Runtime进行下一步的处理
    • 启动App时,runtime所做的事情有

      • 调用map_images进行可执行文件内容的解析和处理
      • load_images中调用call_load_methods,调用所有ClassCategory+load方法
      • 进行各种objc结构的初始化(注册Objc类,初始化类对象等等)
      • 调用C++静态初始化器和__attribute((constructor))修饰的函数
    • 到此为止,可执行文件和动态库中所有的符号(Class、Protocol、Selector、IMP、…)都已经按格式成功加载到内存中,被runtime所管理

    • 总结

      • App的启动由dyld主导,将可执行文件加载到内存,顺便加载所有依赖的动态库
      • 并由runtime负责加载成objc定义的结构
      • 所有初始化工作结束后,dyld就会调用main函数
      • 接下来就是UIApplicationMain函数,AppDelegate的application:didFinishLaunchingWithOptions:方法

优化方案

  • 按照不同的阶段
    • dyld
      • 减少动态库,合并一些动态库(定期清理不必要的动态库)
      • 减少Objc类,分类的数量,减少selector的数量(定期清理不必要的类,分类)
      • 减少C++虚函数数量
      • Swift尽量使用struct
    • runtime
      • +initializedispatch_once取代所有的__attribute((constructor))、C++静态构造器 、ObjC的+load
    • main
      • 在不影响用户体验的前提下,尽可能将一些操作延迟,不要全部都放在finishLaunch方法中
      • 按需加载

安装包瘦身

  • 安装包(IPA)主要由可执行文件、资源组成

  • 资源(图片、视频、音频等)

    • 采取无损压缩
    • 去除没有用到的资源(github :LSUnusedResources)
  • 可执行文件瘦身

    • 编译器优化
      • Strip Linked Product 、 Make Strings Read-Only、 Symbols Hidden By Defaults设置为YES
      • 去掉异常支持,Enable C++ Exceptions、Enable Objective-C Exceptions 设置为NO,Other C Flags 添加 -fno-exceptions
    • 利用AppCode(https://www.jetbrains.com/objc)检测未使用的代码:菜单栏 -> Code -> Inspect Code
    • 编写LLVM插件检测出重复代码,未被调用的代码
    • 生成Link Map文件,可以查看可执行文件的具体组成(在Build Setting->Write Link Map File 改为true,就可以在Path to link map file 看到这个文件)
    • 可以借助第三方工具解析LinkMap文件:https://github.com/huanxsd/LinkMap