一道算法题需要按照间距合并多张不同大小的图片,故自己实现了一下,该拼接图片的方法也可用于论文插图。
题目:
1、在尺寸为 2048 * 2048 的黑色背景图片中,依次填充 images 中的气球图片,气球图片的间隔至少大于 20 个像素,填充完成并保存,如果填充溢出,可保存多张图片。
2、annotations.json 中对应每一个气球的标注的掩膜坐标信息,请根据 annotations 中的格式生成新的 json 标注文件,并确保新生成的 json 标注文件里的掩膜坐标信息对应需求 1 中保存的图片。
3、请验证需求 2 中新生成 json 文件掩膜标注信息的正确性。
- 代码中仅实现了题目中的问题1,也就是合并images文件夹中的25张图片,这里25张图的比例大小不一样,采用等比例resize然后填充的方法,将图片大小都调整到512x512来实现,其中设置了间距interval,interval=0时,每张512x512的图为无缝连接的。
- 设定背景图为纯黑色2048x2048,实现时按照4行4列合并,25张图片会自动保存为2张2048x2048的图,一张中是16张,一张中是9张,如文末的merge1.jpg和merge2.jpg所示。
- 可以修改背景图尺寸、行数、列数、图片间间隔,可用于论文图片排版。
# -*- coding: utf-8 -*-
import cv2
import os
import numpy as np
def cv_show(name, img, k=0, width=512, height=512):
cv2.namedWindow(name, cv2.WINDOW_NORMAL)
cv2.resizeWindow(name, width, height)
cv2.imshow(name, img)
cv2.waitKey(k)
def letter_box(image, dim, interval=0):
h, w = dim
h -= interval * 2
w -= interval * 2
height, width = image.shape[0], image.shape[1]
ratio = min(w/width, h/height)
nw = int(width * ratio)
nh = int(height * ratio)
dh = (h-nh)//2
dw = (w-nw)//2
resized_image = cv2.resize(image, (nw, nh))
output = np.zeros((dim[0], dim[1], 3), dtype=np.uint8)
output[dh+interval:dh+interval+nh, dw+interval:dw+interval+nw, :] = resized_image
return output, ratio, dh, dw
if __name__ == '__main__':
root_path = './images/'
names = os.listdir(root_path)
imgs = [cv2.imread(os.path.join(root_path, name)) for name in names]
merge_size = (2048, 2048) # 背景图尺寸
rows = 4 # 行数设定
columns = 4 # 列数设定
interval = 20 # 图片间的最小间隔
# 计算子图需要resize的尺寸
assert merge_size[0] % columns == 0 and merge_size[1] % rows == 0, '%s or %s is not multiples of %s' % (rows, columns, merge_size)
h = merge_size[0] // columns
w = merge_size[1] // rows
# 计算需要几张背景图
if len(names) <= rows*columns:
num = 1
else:
if len(names) % (rows*columns) == 0:
num = len(names)//(rows*columns)
else:
num = len(names)//(rows*columns)+1
canvas = np.zeros((num, merge_size[0], merge_size[1], 3), dtype=np.uint8)
# 合并图片
cnt = 0
for n in range(len(names)):
for k in range(num):
for j in range(columns):
for i in range(rows):
if cnt == len(names):
break
canvas[k][j*h:(j+1)*h, i*w:(i+1)*w, :], ratio, dh, dw = letter_box(imgs[cnt+n//(rows*columns)], (h, w), interval=interval)
# TODO: 读入json数据,通过ratio, dw, dh, interval计算合并后的新位置
# cv_show('black', canvas[k])
cnt += 1
cv2.imwrite('merge_%s.jpg' % k, canvas[k])
print('cnt: ', cnt)
合并后的效果如下:
merge1.jpg
merge2.jpg