python多张不同大小的图片按照间距合并/填充

2023-03-27 08:48:27

一道算法题需要按照间距合并多张不同大小的图片,故自己实现了一下,该拼接图片的方法也可用于论文插图。

题目
1、在尺寸为 2048 * 2048 的黑色背景图片中,依次填充 images 中的气球图片,气球图片的间隔至少大于 20 个像素,填充完成并保存,如果填充溢出,可保存多张图片。
2、annotations.json 中对应每一个气球的标注的掩膜坐标信息,请根据 annotations 中的格式生成新的 json 标注文件,并确保新生成的 json 标注文件里的掩膜坐标信息对应需求 1 中保存的图片。
3、请验证需求 2 中新生成 json 文件掩膜标注信息的正确性。

  • 代码中仅实现了题目中的问题1,也就是合并images文件夹中的25张图片,这里25张图的比例大小不一样,采用等比例resize然后填充的方法,将图片大小都调整到512x512来实现,其中设置了间距interval,interval=0时,每张512x512的图为无缝连接的。
  • 设定背景图为纯黑色2048x2048,实现时按照4行4列合并,25张图片会自动保存为2张2048x2048的图,一张中是16张,一张中是9张,如文末的merge1.jpg和merge2.jpg所示。
  • 可以修改背景图尺寸、行数、列数、图片间间隔,可用于论文图片排版。
# -*- coding: utf-8 -*- 
import cv2
import os
import numpy as np


def cv_show(name, img, k=0, width=512, height=512):
    cv2.namedWindow(name, cv2.WINDOW_NORMAL)
    cv2.resizeWindow(name, width, height)
    cv2.imshow(name, img)
    cv2.waitKey(k)


def letter_box(image, dim, interval=0):
    h, w = dim
    h -= interval * 2
    w -= interval * 2
    height, width = image.shape[0], image.shape[1]
    ratio = min(w/width, h/height)
    nw = int(width * ratio)
    nh = int(height * ratio)
    dh = (h-nh)//2
    dw = (w-nw)//2
    resized_image = cv2.resize(image, (nw, nh))
    output = np.zeros((dim[0], dim[1], 3), dtype=np.uint8)
    output[dh+interval:dh+interval+nh, dw+interval:dw+interval+nw, :] = resized_image

    return output, ratio, dh, dw


if __name__ == '__main__':
    root_path = './images/'
    names = os.listdir(root_path)
    imgs = [cv2.imread(os.path.join(root_path, name)) for name in names]

    merge_size = (2048, 2048)   # 背景图尺寸
    rows = 4                    # 行数设定
    columns = 4                 # 列数设定
    interval = 20               # 图片间的最小间隔

    # 计算子图需要resize的尺寸
    assert merge_size[0] % columns == 0 and merge_size[1] % rows == 0, '%s or %s is not multiples of %s' % (rows, columns, merge_size)
    h = merge_size[0] // columns
    w = merge_size[1] // rows

    # 计算需要几张背景图
    if len(names) <= rows*columns:
        num = 1
    else:
        if len(names) % (rows*columns) == 0:
            num = len(names)//(rows*columns)
        else:
            num = len(names)//(rows*columns)+1
    canvas = np.zeros((num, merge_size[0], merge_size[1], 3), dtype=np.uint8)

    # 合并图片
    cnt = 0
    for n in range(len(names)):
        for k in range(num):
            for j in range(columns):
                for i in range(rows):
                    if cnt == len(names):
                        break
                    canvas[k][j*h:(j+1)*h, i*w:(i+1)*w, :], ratio, dh, dw = letter_box(imgs[cnt+n//(rows*columns)], (h, w), interval=interval)
                    # TODO: 读入json数据,通过ratio, dw, dh, interval计算合并后的新位置
                    # cv_show('black', canvas[k])
                    cnt += 1
            cv2.imwrite('merge_%s.jpg' % k, canvas[k])
    print('cnt: ', cnt)

合并后的效果如下:
merge1.jpg
在这里插入图片描述

merge2.jpg
在这里插入图片描述

  • 作者:Julyers
  • 原文链接:https://blog.csdn.net/weixin_41631106/article/details/127721469
    更新时间:2023-03-27 08:48:27