null - 程序员宅基地

用Python和OpenCV实现照片马赛克拼图（蒙太奇照片）_机器学习马赛克照片拼接-程序员宅基地

技术标签：索引文件 python 下载图片 Photomosaic 蒙太奇照片 openCV 相片马赛克

https://www.bilibili.com/video/av39158788

马赛克拼图介绍：

相片马赛克（Photomosaic），或称蒙太奇照片、蒙太奇拼贴，是一种影像处理的艺术技巧，利用这个方式做出来的图片，近看时是由许多张小照片合在一起的，但远看时，每张照片透过光影和色彩的微调，组成了一张大图的基本像素，就叫做相片马赛克技巧。最先是由一个美国大学生发明的，但当时限于计算机性能，无法大量应用。（来源于维基百科相片相片马赛克）

这是最终得到的效果，如果你的图片集不同，或者参数设置不同，效果也会有差别。

基本原理：

对于要绘制的图的每一个像素，都在图像集中找和这个像素RGB值最接近的图像，然后放在这个位置。

下面是我的实现整个工程的步骤：

1，收集图片素材

要做出上述的效果来，首先就需要大量的图片，图片少了，效果肯定不好，容易重复，需要的像素值找不到相近的等等弊端。人工收集图片的话肯定是非常慢的，如果要手工下载图片，那至少要找图片找很多天了。这个时候一般有两个解决途径：

爬取图片

用网络爬虫从别的网站上爬取图片是个不错的选择，也可以用python来实现。

下载图片数据集

网络上有别人已经整理好的图像数据集，我使用的是斯坦福大学李飞飞制作的ImageNet数据集。这个数据集是计算机视觉领域常用的一种数据集，它的训练集大概有100多个G，测试集有10多个G，只是测试集就有10万张图片，够本工程使用了。所以我下载的是他的测试集。网速快的话可以十来分钟就下载下来。

图片数据集的迅雷下载链接

2，图片预处理

由于每张图片的大小不一致，拼图的时候不好处理，所以首先用OpenCV读取每个图片，再把它们的大小都改为100*100。一次更改，使用多次。代码如下：

#coding=utf-8
 
import os#和文件有关的模块
import cv2#OpenCV
 
#这里是10万张图片所在的文件夹，你可以按照你的路径改下面的代码。另外路径好像不支持中文字符。
readPath=r"f:\ILSVRC2012_img_test"
 
#这里是改变大小之后的图片，要保存的路径。save是一个文件夹
savePath=r"f:\save"
 
#用一个列表保存所有的图片的文件名字
files=os.listdir(readPath)
 
#n变量用来看到10万张图片的处理进度。
n=0
 
#遍历所有图片文件们
for file in files:
    n+=1
    imgPath=readPath+ "\\" + file#构造图片路径
    img=cv2.imread(imgPath)#读取图片到内存img变量
    img=cv2.resize(img,(100,100))#更改图片的大小
    # 更改之后写入文件，方便以后使用。否则你生成一张马赛克就要处理一次10万张图片
    cv2.imwrite(savePath+ "\\"+file,img)
    print(n)
    
cv2.waitKey()

3，建立索引

建立索引就是保存每张图片出现次数最多的像素值然后保存到文件中。格式为：

文件名称：B,G,R

建立好索引文件之后，就可以知道每个图片和他们最常见的颜色。在使用这些图片的时候，就可以读取整个索引文件，然后定位到图片文件本身。试想一下，如果没有这些索引文件，那么生成一次马赛克拼图就要求一次所有图片的最多像素，太多冗余了。下面是代码：

import cv2
import  os
import collections
 
readPath=r"f:\save"
files=os.listdir(readPath)
n=0
s=''
for file in files  :
    li=[]
    n+=1
    imgPath = readPath + "\\" + file
    img=cv2.imread(imgPath)
    for i in range(100):
        for j in range(100):
            b=img[i,j,0]
            g=img[i,j,1]
            r=img[i,j,2]
            li.append((b,g,r))
 
    most=collections.Counter(li).most_common(1)
    s += file
    s += ":"
    s += str(most[0][0]).replace("(","").replace(")","")
    s += "\n"
    print(n)
 
f = open('filename.txt','w')
f.write(s)

生成的索引文件格式是这样的：

4，画图

首先是读取步骤3生成的索引文件。然后可以选择打乱它，以免一样的图片聚集出现在一个位置附近。

假设目标图片是n*m的，那么新建一个n*100，m*100的图片（这里是100的整数倍是因为刚才把图片集中的每个图片都更改为100*100大小的了）。这是一个很大的图片。对于原图片的每个像素，都遍历索引文件，找到和BGR像素值的欧式距离（你也可以采取其他度量方式，甚至可以找最相近的图片，但这样将导致同图片的聚集，因为相邻的像素值很可能一样的）不大于一个阈值的索引文件中的值，然后根据找到的BGR定位到具体的文件，由文件再读取图片，把图片放到大图上的具体位置。下面是具体代码：

import  cv2
import numpy as np
 
readPath=r"f:\save"
 
def readIndex():
    fs = open("filename.txt","r")
    n=0
    dic=[]
    for line in fs.readlines():
        n+=1
        temp=line.split(":")
        file=temp[0]
        bgr=temp[1].split(",")
        b=int(bgr[0])
        g=int(bgr[1])
        r=int(bgr[2])
        dic.append((file,(b,g,r)))
    return dic
 
 
img=cv2.imread("york.jpg")
s=np.shape(img)
big= np.zeros((100*s[0], 100*s[1], 3), dtype=np.uint8)
 
list=readIndex()#读取索引文件到变量中
 
for i in range(s[0]):#遍历行和列
    for j in range(s[1]):
        print(i)
        b = img[i, j, 0]
        g = img[i, j, 1]
        r = img[i, j, 2]#获取图像当前位置的BGR值
        
        np.random.shuffle(list)#打乱索引文件
        
        for item in list:
            imgb=item[1][0]
            imgg=item[1][1]
            imgr=item[1][2]#获取索引文件的RGB值
            
            distance=(imgb-b)**2+(imgg-g)**2+(imgr-r)**2#欧式距离
            if distance<100:
                filepath=readPath+"\\"+str(item[0])#定位到具体的图片文件
                break
        little=cv2.imread(filepath)#读取整个最相近的图片
        big[i*100:(i+1)*100,j*100:(j+1)*100]=little#把图片画到大图的相应位置
 
cv2.imwrite("bigYork.jpg",big)#输出大图到文件中

大功告成。

下面是我的时间统计：

下载图片用了三个多小时
图片预处理用了一个多小时
建立索引大概需要一个多小时
之后画每个一万个像素点左右的图片大概需要三分钟的时间

其他链接

本文链接：https://blog.csdn.net/york1996/article/details/84489051

原作者删帖不实内容删帖广告或垃圾文章投诉

智能推荐

Kotlin 解压缩_kotlin 对上传的压缩包进行分析-程序员宅基地

文章浏览阅读638次。fun unZip(zipFile: String, context: Context) { var outputStream: OutputStream? = null var inputStream: InputStream? = null try { val zf = ZipFile(zipFile) val entries = zf.entries() while (en..._kotlin 对上传的压缩包进行分析

64K方法数限制解决办法_java函数大于64k编译失败-程序员宅基地

文章浏览阅读1.9k次。随着业务逻辑越来越多，业务模块也越来越大，不可避免会遇到64K方法数的限制。最直观的表现就是编译报错：较早版本的编译系统中，错误内容如下：Conversion to Dalvik format failed:Unable to execute dex: method ID not in [0, 0xffff]: 65536较新版本的编译系统中，错误内容如下：trouble writing outp_java函数大于64k编译失败

案例分享——低压电力线载波通信模组（借助电源线实现远距离数据传输、宽压输入、波特率范围广、应用场景多样化）_电力载波模块csdn-程序员宅基地

文章浏览阅读2k次，点赞7次，收藏10次。物联网领域，有很多数据通信场景，因为原设备整体系统结构、运行环境等方面的限制，需求在不增加通信数据线缆的情况下实现数据的远程传输，因为特殊应用场景下考虑到环境的限制，还不能使用常规的无线通信手段，所以借助电源线缆进行传输的电力线载波技术应运而生，本次博文给大家分享的就是博主完全自主研发的低压电力线载波通信模组。_电力载波模块csdn

密码学基础_密码体制的五个要素-程序员宅基地

文章浏览阅读7.4k次。密码学基本概念密码学（Cryptology）是结合数学、计算机科学、电子与通信等学科于一体的交叉学科，研究信息系统安全的科学。起源于保密通信技术。具体来讲，研究信息系统安全保密和认证的一门科学。密码编码学，通过变换消息（对信息编码）使其保密的科学和艺术密码分析学，在未知密钥的情况下从密文推_密码体制的五个要素

python支持中文路径_基于python 处理中文路径的终极解决方法-程序员宅基地

文章浏览阅读1.9k次。1 、据说python3就没有这个问题了2 、u'字符串' 代表是unicode格式的数据，路径最好写成这个格式，别直接跟字符串'字符串'这类数据相加，相加之后type就是str，这样就会存在解码失误的问题。别直接跟字符串'字符串'这类数据相加别直接跟字符串'字符串'这类数据相加别直接跟字符串'字符串'这类数据相加unicode类型别直接跟字符串'字符串'这类数据相加说四遍3 、有些读取的方式偏偏..._python 路径中文

阿里云 B 站直播首秀，用 Serverless 搭个游戏机？-程序员宅基地

文章浏览阅读107次。最近，阿云 B 站没声音，是在憋大招！8月5日周四 19:00 是阿里云的直播首秀，给大家请来了 Forrester 评分世界第一的 Serverless 团队产品经理江昱，给大家在线...._阿里云直播b站

随便推点

AS 3.1.3连续依赖多个Module，导致访问不到Module中的类_为什么as在一个包下建了多个module,缺无法打开了-程序员宅基地

文章浏览阅读1.1k次。我好苦啊，半夜还在打代码。还出bug，狗日的。问题是这样的：我在新建的项目里，建了两个Module: fiora-ec和fiora-core。项目的依赖顺序是这样的，App依赖fiora-ec,fiora-ec又依赖于fiora-core，因为这种依赖关系，所有可以在app和fiora-ec中删除一些不必要的引入，比如这个玩意儿：com.android.support:appcompat-v7:..._为什么as在一个包下建了多个module,缺无法打开了

Magento 常用插件二-程序员宅基地

文章浏览阅读1.4k次。1. SMTP 插件 URL：http://www.magentocommerce.com/magento-connect/TurboSMTP/extension/4415/aschroder_turbosmtp KEY：magento-community/Aschroder_TurboSmtp 2. Email Template Adapter..._magento extension pour ricardo.ch

【连载】【FPGA黑金开发板】Verilog HDL那些事儿--低级建模的资源（六）-程序员宅基地

文章浏览阅读161次。声明：本文为原创作品，版权归akuei2及黑金动力社区共同所有，如需转载，请注明出处http://www.cnblogs.com/kingst/ 2.5 低级建模的资源低级建模有讲求资源的分配，目的是使用“图形”来提高建模的解读性。图上是低级建模最基本的建模框图，估计大家在实验一和实验二已经眼熟过。功能模块（低级功能模块）是一个水平的长方形，而控制模块（低级控制模块）是矩形。组..._cyclone ep2c8q208c黑金开发板

R语言实用案例分析-1_r语言案例分析-程序员宅基地

文章浏览阅读2.2w次，点赞10次，收藏63次。在日常生活和实际应用当中，我们经常会用到统计方面的知识，比如求最大值，求平均值等等。R语言是一门统计学语言，他可以方便的完成统计相关的计算，下面我们就来看一个相关案例。1. 背景最近西安交大大数据专业二班，开设了Java和大数据技术课程，班级人数共100人。2. 需求通过R语言完成该100位同学学号的生成，同时使用R语言模拟生成Java和大数据技术成绩，成绩满分为100，需要满足正_r语言案例分析

Java知识体系总结（2024版），这一次带你搞懂Spring代理创建过程-程序员宅基地

文章浏览阅读639次，点赞11次，收藏26次。虽然我个人也经常自嘲，十年之后要去成为外卖专员，但实际上依靠自身的努力，是能够减少三十五岁之后的焦虑的，毕竟好的架构师并不多。架构师，是我们大部分技术人的职业目标，一名好的架构师来源于机遇(公司)、个人努力(吃得苦、肯钻研)、天分(真的热爱)的三者协作的结果，实践+机遇+努力才能助你成为优秀的架构师。如果你也想成为一名好的架构师，那或许这份Java成长笔记你需要阅读阅读，希望能够对你的职业发展有所帮助。一个人可以走的很快，但一群人才能走的更远。

车辆动力学及在Unity、UE4中的实现_unity 车辆动力学模型-程序员宅基地

文章浏览阅读3.9k次，点赞9次，收藏53次。受力分析直线行驶时的车轮受力如下：水平方向上，所受合力为：F=Ft+Fw+FfF=F_t+F_w+F_fF=Ft+Fw+Ff其中，FtF_tFt为牵引力，FwF_wFw为空气阻力，FfF_fFf为滚动阻力，下面我们将逐个介绍。驱动力先来说扭矩，扭矩是使物体发生旋转的一个特殊力矩，等于力和力臂的乘积，单位为N∙mN∙mN∙m：设驱动轴的扭矩为TtT_tTt，车轮半径为rrr，那么牵引力：Ft=Tt⁄rF_t=T_t⁄rFt=Tt⁄r如何求得驱动轴扭矩TtT_tTt呢？_unity 车辆动力学模型

用Python和OpenCV实现照片马赛克拼图（蒙太奇照片）_机器学习马赛克照片拼接-程序员宅基地

马赛克拼图介绍：

基本原理：

1，收集图片素材

2，图片预处理

3，建立索引

4，画图

智能推荐

Kotlin 解压缩_kotlin 对上传的压缩包进行分析-程序员宅基地

64K方法数限制解决办法_java函数大于64k编译失败-程序员宅基地

案例分享——低压电力线载波通信模组（借助电源线实现远距离数据传输、宽压输入、波特率范围广、应用场景多样化）_电力载波模块csdn-程序员宅基地

密码学基础_密码体制的五个要素-程序员宅基地

python支持中文路径_基于python 处理中文路径的终极解决方法-程序员宅基地

阿里云 B 站直播首秀，用 Serverless 搭个游戏机？-程序员宅基地

随便推点

AS 3.1.3连续依赖多个Module，导致访问不到Module中的类_为什么as在一个包下建了多个module,缺无法打开了-程序员宅基地

Magento 常用插件二-程序员宅基地

【连载】【FPGA黑金开发板】Verilog HDL那些事儿--低级建模的资源（六）-程序员宅基地

R语言实用案例分析-1_r语言案例分析-程序员宅基地

Java知识体系总结（2024版），这一次带你搞懂Spring代理创建过程-程序员宅基地

车辆动力学及在Unity、UE4中的实现_unity 车辆动力学模型-程序员宅基地

推荐文章

热门文章

相关标签

用Python和OpenCV实现照片马赛克拼图（蒙太奇照片）_机器学习 马赛克照片拼接-程序员宅基地

马赛克拼图介绍：

基本原理：

1，收集图片素材

2，图片预处理

3，建立索引

4，画图

智能推荐

随便推点

推荐文章

热门文章

相关标签

用Python和OpenCV实现照片马赛克拼图（蒙太奇照片）_机器学习马赛克照片拼接-程序员宅基地