图像着色¶

本示例将展示如何使用PaddleHub对预训练模型进行finetune并完成预测任务。

命令行预测¶

$ hub run user_guided_colorization --input_path "/PATH/TO/IMAGE"

如何开始Fine-tune¶

在完成安装PaddlePaddle与PaddleHub后，通过执行python train.py即可开始使用user_guided_colorization模型对Canvas等数据集进行Fine-tune。

代码步骤¶

使用PaddleHub Fine-tune API进行Fine-tune可以分为4个步骤。

Step1: 定义数据预处理方式¶

import paddlehub.vision.transforms as T

transform = T.Compose([T.Resize((256, 256), interpolation='NEAREST'),
                       T.RandomPaddingCrop(crop_size=176),
                       T.RGB2LAB()], to_rgb=True)

transforms数据增强模块定义了丰富的数据预处理方式，用户可按照需求替换自己需要的数据预处理方式。

NOTE: 要将T.Compose中to_rgb设定为True.

Step2: 下载数据集并使用¶

from paddlehub.datasets import Canvas

color_set = Canvas(transform=transform, mode='train')

transform: 数据预处理方式。
mode: 选择数据模式，可选项有 train, test 默认为train。

数据集的准备代码可以参考 canvas.py。hub.datasets.Canvas() 会自动从网络下载数据集并解压到用户目录下$HOME/.paddlehub/dataset目录。

Step3: 加载预训练模型¶

model = hub.Module(name='user_guided_colorization', load_checkpoint=None)
model.set_config(classification=True, prob=1)

name:加载模型的名字。
load_checkpoint: 是否加载自己训练的模型，若为None，则加载提供的模型默认参数。
classification: 着色模型分两部分训练，开始阶段classification设置为True, 用于浅层网络训练。训练后期将classification设置为False, 用于训练网络的输出层。
prob: 每张输入图不加一个先验彩色块的概率，默认为1，即不加入先验彩色块。例如，当prob设定为0.9时，一张图上有两个先验彩色块的概率为(1-0.9)*(1-0.9)*0.9=0.009.

Step4: 选择优化策略和运行配置¶

optimizer = paddle.optimizer.Adam(learning_rate=0.0001, parameters=model.parameters())
trainer = Trainer(model, optimizer, checkpoint_dir='img_colorization_ckpt_cls_1')
trainer.train(color_set, epochs=201, batch_size=25, eval_dataset=color_set, log_interval=10, save_interval=10)

优化策略¶

Paddle2.0-rc提供了多种优化器选择，如SGD, Adam, Adamax等，详细参见策略。

其中Adam:

learning_rate: 全局学习率。默认为1e-4；
parameters: 待优化模型参数。

运行配置¶

Trainer 主要控制Fine-tune的训练，包含以下可控制的参数:

model: 被优化模型；
optimizer: 优化器选择；
use_vdl: 是否使用vdl可视化训练过程；
checkpoint_dir: 保存模型参数的地址；
compare_metrics: 保存最优模型的衡量指标；

trainer.train 主要控制具体的训练过程，包含以下可控制的参数：

train_dataset: 训练时所用的数据集；
epochs: 训练轮数；
batch_size: 训练的批大小，如果使用GPU，请根据实际情况调整batch_size；
num_workers: works的数量，默认为0；
eval_dataset: 验证过程所用的数据集；
log_interval: 打印日志的间隔，单位为执行批训练的次数。
save_interval: 保存模型的间隔频次，单位为执行训练的轮数。

模型预测¶

当完成Fine-tune后，Fine-tune过程在验证集上表现最优的模型会被保存在${CHECKPOINT_DIR}/best_model目录下，其中${CHECKPOINT_DIR}目录为Fine-tune时所选择的保存checkpoint的目录。

我们使用该模型来进行预测。predict.py脚本如下：

import paddle
import paddlehub as hub

if __name__ == '__main__':
    model = hub.Module(name='user_guided_colorization', load_checkpoint='/PATH/TO/CHECKPOINT')
    model.set_config(prob=0.1)
    result = model.predict(images=['house.png'])

参数配置正确后，请执行脚本python predict.py，加载模型具体可参见加载。

NOTE: 进行预测时，所选择的module，checkpoint_dir，dataset必须和Fine-tune所用的一样。若想获取油画风着色效果，请下载参数文件油画着色

Args

images:原始图像路径或者BGR格式图片；
visualization: 是否可视化，默认为True；
save_path: 保存结果的路径，默认为’result’。

服务部署¶

PaddleHub Serving可以部署一个在线着色任务服务。

Step1: 启动PaddleHub Serving¶

运行启动命令：

$ hub serving start -m user_guided_colorization

这样就完成了一个着色任务服务化API的部署，默认端口号为8866。

NOTE: 如使用GPU预测，则需要在启动服务之前，请设置CUDA_VISIBLE_DEVICES环境变量，否则不用设置。

Step2: 发送预测请求¶

配置好服务端，以下数行代码即可实现发送预测请求，获取预测结果

import requests
import json
import cv2
import base64

import numpy as np


def cv2_to_base64(image):
    data = cv2.imencode('.jpg', image)[1]
    return base64.b64encode(data.tostring()).decode('utf8')

def base64_to_cv2(b64str):
    data = base64.b64decode(b64str.encode('utf8'))
    data = np.fromstring(data, np.uint8)
    data = cv2.imdecode(data, cv2.IMREAD_COLOR)
    return data

# 发送HTTP请求
org_im = cv2.imread('/PATH/TO/IMAGE')
data = {'images':[cv2_to_base64(org_im)]}
headers = {"Content-type": "application/json"}
url = "http://127.0.0.1:8866/predict/user_guided_colorization"
r = requests.post(url=url, headers=headers, data=json.dumps(data))
data = base64_to_cv2(r.json()["results"]['data'][0]['fake_reg'])
cv2.imwrite('color.png', data)

查看代码¶

https://github.com/richzhang/colorization-pytorch

依赖¶

paddlepaddle >= 2.0.0rc

paddlehub >= 2.0.0

Table Of Contents

图像着色

图像分类

风格迁移