OpenGL 图片处理

需求背景

目前我们 app 的发布工具的拍照功能需要更多丰富的元素吸引年轻人，急需一套图像处理工具来做一些有意思的功能来供用户使用，来增加他们UGC的兴趣，丰富社区内容。

需要的功能

产品目前初步需要实现以下功能：人像描边、背景切换、自定义区域处理等，最终实现的效果如下：

以上白点形成的多边形为用户输入的区域，只对区域内的部分做描边和背景替换。

准备工作，如何用OpenGL 定制 imageView

考虑到与安卓端的通用性，一份 shader 两边都能使用，选择使用 OpenGL ES 实现相应功能。主要程序实现了一个GLImageView，其功能相当于一块画板，是内容绘制的主体。GLImageView 继承自 UIView，但是使用mEaglLayer来替换原来的 layer 来完成对应的功能。

GLImageView 绘制流程

GLImageView 的绘制流程放在 layoutSubviews 里面执行，过程很简单：

创建图层，主要对 mEaglLayer 做一些设置
创建上下文，设置 context
清空缓存区，清空上一帧遗留的 buffer 数据
设置 RenderBuffer，渲染缓存
设置 FrameBuffer，帧缓存
开始绘制，下文详述

关于OpenGL 缓存的概念可以这么理解：

buffer分为frame buffer 和 render buffer2个大类。
其中frame buffer 相当于render buffer的管理者。
frame buffer object即称FBO。
render buffer则又可分为3类。colorBuffer、depthBuffer、stencilBuffer。

第 6 步实际的绘制过程其实很简单，加载 shader、往 shader 传参、绘制渲染：

加载 Shader

OpenGL 渲染管线中可编程的阶段有2个：顶点着色器 vsh（Vertex Shader）和片元着色器 fsh（Fragment Shader），在绘制前需要加载编译链接我们编写的 vsh 和 fsh 程序到 GPU 供接下来的渲染使用：

if self.compileShader(&verShader, type: GLenum(GL_VERTEX_SHADER), file: verFile) == false {
    print("Failed to compile vertex shader")
}
// compileshader(with: &fragShader, type: GLenum(GL_FRAGMENT_SHADER), file: fragFIle)
if self.compileShader(&fragShader, type: GLenum(GL_FRAGMENT_SHADER), file: fragFIle) == false {
    print("Failed to compile fragShader")
}

glAttachShader(program, verShader)
glAttachShader(program, fragShader)

//绑定后不需要了要释放掉
glDeleteShader(verShader)
glDeleteShader(fragShader)

往 Shader 传顶点数据

由于我们的目的只是在一块二维区域绘制我们的图片并作处理，暂时我们只需要指定顶点数据、纹理数据即可：

let attrArr: [GLfloat] = [
  1, 1, -1.0,     1.0, 0.0,
  -1, -1, -1.0,     0.0, 1.0,
  -1, 1, -1.0,    0.0, 0.0,

  1, -1, -1.0,      1.0, 1.0,
  -1, -1, -1.0,     0.0, 1.0,
  1, 1, -1.0,     1.0, 0.0,
]

数组的的每 5 位表示一个点，前 3 位为顶点物理坐标的 xyz 值，由于是只需要二维的坐标所以z为恒定值-1，后2位为对应的纹理坐标的 xy 值。如果你认真在画了各个点的位置，会发现坐标位置是上下颠倒的，这是因为 iOS 的坐标系统和 OpenGL坐标系统 y 轴方向不一致的原因。

载入 attrArr 的方法如下：

// 第1步：attrArr 拷贝到显存
var attrBuffer = GLuint()
glGenBuffers(1, &attrBuffer)
glBindBuffer(GLenum(GL_ARRAY_BUFFER), attrBuffer)
glBufferData(GLenum(GL_ARRAY_BUFFER), MemoryLayout<GLfloat>.size * 30, attrArr, GLenum(GL_DYNAMIC_DRAW))
// 第2步：顶点坐标数据传给vsh：position
let position = glGetAttribLocation(mprograme, "position")
glEnableVertexAttribArray(GLuint(position))
glVertexAttribPointer(GLuint(position), 3, GLenum(GL_FLOAT), GLboolean(GL_FALSE), GLsizei(MemoryLayout<GLfloat>.size * 5), nil)
// 第3步：纹理坐标数据传给vsh：textureCoordinate
let textCoor = glGetAttribLocation(mprograme, "textureCoordinate")
glEnableVertexAttribArray(GLuint(textCoor))
glVertexAttribPointer(GLuint(textCoor), 2, GLenum(GL_FLOAT), GLboolean(GL_FALSE), GLsizei(MemoryLayout<GLfloat>.size * 5), BUFFER_OFFSET(MemoryLayout<GLfloat>.size * 3))

通过上面的方法就将顶点坐标数据和对应的纹理坐标数据分别传给 vsh 的 attribute 变量 position 和 textureCoordinate，这里顺便给出 vsh 的代码：

// 输入
attribute vec4 position;
attribute vec2 textureCoordinate;
// 输出给 fsh
varying highp vec2 v_textureCoord;

void main() {
    v_textureCoord = textureCoordinate;
    gl_Position = position;
}

往 Shader 传纹理数据

载入图片纹理的核心代码如下：

----GLImageView.swift----
...
loadTextureFromImge(img: self.image)
glUniform1i(glGetUniformLocation(mprograme, "colorMap"), 0)
...

----shaderStroke.fsh----
...
uniform sampler2D colorMap;
...

其中 loadTextureFromImge() 将一张图片当作纹理载入，glUniform1i() 表示将索引为0的纹理，指定为 Uniform 变量 colorMap 的值。

绘制渲染

绘制和渲染分别调用2个函数：

glDrawArrays(GLenum(GL_TRIANGLES), 0, 6) 
mContext?.presentRenderbuffer(Int(GL_RENDERBUFFER))

准备工作做完了就用 OpenGL 实现了一个自定义的 view 来展示我们的图片，其中部分细节可以到源码里面查看。

人体抠图

这一步的目的是从任意一张图里面，抠出人像，并使人像尽可能的占满图片。其中抠图使用的是百度人像分割 Api，得到的是一张只有人像的图，背景全部替换成透明颜色值。接下来需要求最小的、能包含整个人像的 rect 即可，这一步使用 core graph 来做，直接遍历像素点即可，关键代码如下：

size_t w = CGImageGetWidth(inImage);
d0 = w/64;
unsigned char* data = CGBitmapContextGetData (cgctx);
minX = [self getMinX: data width: w height: h];

- (int) getMinX:(unsigned char*)data width: (CGFloat)w height: (CGFloat)h {
    for (int x=1; x<w; x+=d0){
        if ([self testXWith:data pointX:x width:w height:h]) {
            return x-d0>0 ? x-d0 : 0;
        }
    }
    return 0;
}

// 竖线检测
- (BOOL) testXWith:(unsigned char*)data pointX: (int)p_x width: (int)w height: (int)h {
    for (int i = 0; i<h; i+=d1) {
        int offset = 4*((w*round(i))+round(p_x));
        int alpha =  data[offset];
        if (alpha>10) {
            return true;
        }
    }
    return false;
}

上面代码描述了求 minX 的步骤，往 x 正方向遍历，对每个 X=x 的直线若第一次与人像相交则 x 即为minX 的值。为了防止图片尺寸太大设置便利步长为 d0 = width/64。

得到最小 rect 后直接用 CGContextDrawImage 函数转换就可以得到最小的包含人像的图。这一步的过程如下：

左上为原图，右上为百度处理的结果，下面的为最小包围人像的图。（补充：百度的 api 的结果 person_info 字段其实返回了抠出来的每个人像的box信息，将这些box合并成一个大的box也行，但是效果不可控，结果可能会有误差）

人像描边

到这里我们完成了读取一张图片，抠出其中的人像，得到最小的人像凸包并用OpenGL将它渲染出来这一组功能，接下来可以开始做描边了。

描边的方法有很多，最简单的一种实现思路如下：

if (alpha>0,说明当前片元是人像，不需要处理)  return
当前片元坐标往四周发散试探一定距离，
if 试探到 alpha>0 则对当前片元涂上描边的颜色 return
return

对应 shader 的部分代码如下：

varying highp vec2 v_textureCoord;
uniform sampler2D colorMap;
const highp float alphaRV = 0.4;           // alpha<alphaRV 表示是背景色

void main() {
    highp vec2 textureCoord = v_textureCoord;
    highp vec4 myC = texture2D(colorMap, textureCoord);// 从纹理colorMap读取坐标textureCoord的颜色值
    int strokeCount = 0;
    for (int i=0; i<12; ++i) {
        highp float angel = 30.0*float(i);
        highp float rad = angel * 0.01745329252;  // pi/180，角度转弧度
        highp vec4 clr = texture2D(colorMap, vec2(textureCoord.x + outlineSize * cos(rad) / textureSize.x, textureCoord.y + outlineSize * sin(rad) / textureSize.y));
        if (clr.a > alphaRV) {  // clr不是背景色
        if (clr.r + clr.g + clr.b > 0.1) {
            strokeCount = strokeCount + 1;
        }
        strokeCount = strokeCount + 1;
        }
    }
    if (strokeCount > 0) { // 描边颜色
        myC.rgba = outlineColor;
    } else {               // 背景颜色
        myC = vec4(1.0, 0.0, 0.0, 1.0);
    }
    gl_FragColor = myC;
}

这一步后得到结果如下：

背景替换

背景替换的目的是将背景（上图背景为单调的red）替换成指定的图片，丰富图片的显示元素，这里需要使用 OpenGL 加载多纹理，部分代码如下：

let colorMap = loadTextureFromImge(img: self.image)
let colorMapBackground = loadTextureFromImge(img: self.backgroundImage)
// 设置纹理采样器 0 和 1
glUniform1i(glGetUniformLocation(mprograme, "colorMap"), 0)
glUniform1i(glGetUniformLocation(mprograme, "colorMapBackground"), 1)
// 激活绑定纹理
glActiveTexture(GLenum(GL_TEXTURE0));
glBindTexture(GLenum(GL_TEXTURE_2D), colorMap);
glActiveTexture(GLenum(GL_TEXTURE1));
glBindTexture(GLenum(GL_TEXTURE_2D), colorMapBackground);

通过上述代码，读取了2张图片，传给了fsh的 colorMap 和 colorMapBackground，一个为人像图，一个为要使用的背景色。

对应的 fsh 的相关代码如下：

uniform sampler2D colorMap;
uniform sampler2D colorMapBackground;
void main() {
    ...
    if (strokeCount > 0) { // 描边颜色
        myC.rgba = outlineColor;
    } else {               // 背景颜色替换
        // myC = vec4(1.0, 0.0, 0.0, 1.0);
        highp vec4 jtC = texture2D(colorMapBackground, vec2(textureCoord.x, textureCoord.y));
        myC = jtC;
    }
    ...
}

处理结果如下：

支持在用户选择区域的图像处理

这一步的目的是只在用户输入点的多边形内处理图像，最终效果可以看最上面第一张图，用户输入3个点形成一个三角形，在这个三角形内处理了描边和背景替换，外面不做任何处理。输入端代码如下：

    public override func touchesBegan(_ touches: Set<UITouch>, with event: UIEvent?) {
        let x: GLfloat = GLfloat(touches.first?.location(in: self).x ?? 0.0)
        let y: GLfloat = GLfloat(touches.first?.location(in: self).y ?? 0.0)
        addPoint(x: x, y: y)
        self.layoutSubviews()
    }
    
    public override func touchesMoved(_ touches: Set<UITouch>, with event: UIEvent?) {
        let x: GLfloat = GLfloat(touches.first?.location(in: self).x ?? 0.0)
        let y: GLfloat = GLfloat(touches.first?.location(in: self).y ?? 0.0)
        addPoint(x: x, y: y)
        self.layoutSubviews()
    }
    
    func addPoint(x: GLfloat, y:GLfloat) -> Bool {
        let keyX_Y = NSString(format: "%lf_%lf", x, y)
        let v: Int = touchPointsFlag[keyX_Y] as? Int ?? 0
        if v==0 { // 没有存过
            let count = touchPoints.count
            let toAddX = x*rateX
            let toAddY = y*rateY
            if (count>=2) {
                let lastX: GLfloat = touchPoints[count-2]
                let lastY: GLfloat = touchPoints[count-1]
                let minLength: GLfloat = GLfloat(frame.width+frame.height) / 30.0
                print("addPointTest", (toAddX-lastX)*(toAddX-lastX)+(toAddY-lastY)*(toAddY-lastY), minLength*minLength)
                if ((toAddX-lastX)*(toAddX-lastX)+(toAddY-lastY)*(toAddY-lastY)<minLength*minLength) { // 最近2个点距离太短
                    return false
                }
            }
            
            touchPoints.append(toAddX)
            touchPoints.append(toAddY)
            touchPointsFlag[keyX_Y]=1
            return true
        }
        return false
    }

主要目的是采集用户手指划过的点集，做相近点去重处理。

fsh内部处理的原理如下：

void main() {
    ...
    if (当前点在点集形成的多边形外) return
    继续其它处理
    ...
}   

这里设计一个图形学经典算法，如何判断一个点 p 在点集形成的多边形内部，一个简单判断方法如下：

以p为起始点画任意一条射线，与多边形的每条线段求相交
if（总共相交数为奇数） p在多边形内
else p在多边形外

参考文献：

关于glsl：

https://learnopengl-cn.readthedocs.io/zh/latest/01%20Getting%20started/05%20Shaders/