CN105590307A - 基于透明度的抠图方法和装置 - Google Patents
基于透明度的抠图方法和装置 Download PDFInfo
- Publication number
- CN105590307A CN105590307A CN201410568214.9A CN201410568214A CN105590307A CN 105590307 A CN105590307 A CN 105590307A CN 201410568214 A CN201410568214 A CN 201410568214A CN 105590307 A CN105590307 A CN 105590307A
- Authority
- CN
- China
- Prior art keywords
- pixel
- original image
- neighbor
- image
- matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
Abstract
本发明实施例提供一种基于透明度的抠图方法和装置,该方法包括:获取待抠图的原始图像,对原始图像进行边缘检测,获得检测结果;根据检测结果将全局像素或局部像素作为原始图像中的目标像素的邻居像素;其中,全局像素为在原始图像中根据全局搜索算法获得的像素,局部像素为在原始图像中根据局部搜索算法获得的像素;根据原始图像和邻居像素获得原始图像中的目标像素的透明度值α,根据透明度值,在原始图像中抠出目标物体。本发明实施例提供的基于透明度的抠图方法和装置减小了抠图误差,提高了抠图效果。
Description
技术领域
本发明实施例涉及图像处理技术,尤其涉及一种基于透明度的抠图方法和装置。
背景技术
抠图技术是一种把任意图像中的前景部分从背景中分离出来的一种图像处理技术。在杂志封面、插图设计,广告和影视创作等方面有着广泛而深入的应用。抠图的方式有多种,其中,应用最广泛的是alpha抠图技术。
采用alpha抠图技术进行抠图时,一般认为一幅自然图像中的各个像素点的颜色是该点前景颜色和背景颜色的线性组合,线性系数表示前景颜色在该点颜色中所占的比重,数值在[0,1]之间变化。具体的关系如公式(1.1)所示:
I=αF+(1-α)B(1.1)
其中,I表示该点的颜色值,F和B分别表示该点的前景颜色值和背景颜色值,α为线性组合的系数,表示该点的透明度。对于alpha抠图问题,对图像上的任一点,根据公式(1.1)计算出的α值并不唯一,因此,如何从无数对解中找出最合理的解是非常重要的。
现有技术中,一般通过color-clustering抠图算法,确定出最合理的α值。在color-clustering算法中,通过对图像中的每个像素点,采用K最近邻(KNearestNeighbor,简称:KNN)算法找到与其最相似的相关像素,用“colorballmodel”来建立模型,再结合公式(1.1)得到α的解。
然而,现有技术中,在通过color-clustering算法确定α值的过程中,若对相对简单且包含光滑区域较多的图像进行抠图时,由于是在图像的所有像素点中查找最相似的相关像素,使得抠图结果容易产生误差,导致抠图效果较差。
发明内容
本发明实施例提供一种基于透明度的抠图方法和装置,用以减小抠图误差,提高抠图效果。
第一方面,本发明实施例提供一种基于透明度的抠图方法,包括:
获取待抠图的原始图像,对所述原始图像进行边缘检测,获得检测结果;
根据所述检测结果将全局像素或局部像素作为所述原始图像中的目标像素的邻居像素;其中,所述全局像素为在原始图像中根据全局搜索算法获得的像素,所述局部像素为在原始图像中根据局部搜索算法获得的像素;
根据所述原始图像和所述邻居像素获得所述原始图像中的目标像素的透明度值α,根据所述透明度值,在所述原始图像中抠出目标物体。
结合第一方面,在第一方面的第一种可能的实现方式中,所述对所述原始图像进行边缘检测,具体包括:
将所述原始图像转换成灰度图像,对所述灰度图像进行拉普拉斯滤波和均值滤波处理,获得边缘检测图像。
结合第一方面、第一方面的第一种可能的实现方式,在第一方面的第二种可能的实现方式中,所述根据所述检测结果将全局像素或局部像素作为原始图像中的目标像素的邻居像素,具体包括:
判断所述边缘检测图像中目标像素的像素值是否大于预设阈值;其中,所述边缘检测图像中的目标像素与所述原始图像中的目标像素相对应;
若是,则采用全局像素作为所述原始图像中的目标像素的邻居像素;
若否,则采用局部像素作为所述原始图像中的目标像素的邻居像素。
结合第一方面、第一方面的第一种可能的实现方式,在第一方面的第三种可能的实现方式中,所述根据所述检测结果将全局像素或局部像素作为原始图像中的目标像素的邻居像素,具体包括:
在所述原始图像中的目标像素的多个邻居像素中,确定第一预设数目的邻居像素为局部像素,第二预设数目的邻居像素为全局像素。
结合第一方面、第一方面的第一种至第一方面的第三种任一种可能的实现方式,在第一方面的第四种可能的实现方式中,所述根据所述原始图像和所述邻居像素获得所述原始图像中的目标像素的透明度值α,具体包括:
根据所述原始图像和所述邻居像素获得拉普拉斯矩阵L;
根据拉普拉斯矩阵L和获取的辅助图像构建关于所述原始图像中目标像素的透明度的第一目标函数:J(α)=αTLα+λ(α-bs)TDs(α-bs);其中,α为透明度值,λ为预设参数,Ds为N*N的矩阵,N为所述辅助图像中像素的个数,bs为N*1的向量,N为大于0的整数;
根据所述第一目标函数获得所述原始图像中的目标像素的透明度值α。
结合第一方面的第四种可能的实现方式,在第一方面的第五种可能的实现方式中,所述根据所述原始图像和所述邻居像素获得拉普拉斯矩阵L,具体包括:
根据公式(1)计算邻接矩阵W:
其中,I为所述原始图像,k为所述目标像素,i和j为所述邻居像素集合中两个不同的像素点,Nk为所述邻居像素的集合,uk为所述邻居像素集合中所有像素的均值,Σk为所述邻居像素集合中所有像素的协方差矩阵;
根据公式(2)计算获得拉普拉斯矩阵L:
L=D-W(2)
其中,D为度矩阵,通过公式Dii=ΣjWij获得。
结合第一方面、第一方面的第一种至第一方面的第五种任一种可能的实现方式,在第一方面的第六种可能的实现方式中,所述根据所述拉普拉斯矩阵L和获取的辅助图像构建关于所述原始图像中目标像素的透明度的第一目标函数:J(α)=αTLα+λ(α-bs)TDs(α-bs),具体包括:
根据所述拉普拉斯矩阵L构建关于目标像素的透明度的第二目标函数:
f(α)=αTLα;
获取所述辅助图像,并将所述辅助图像的背景用黑色进行标记,前景用白色进行标记,其它部分用灰色进行标记,以获取标记后的辅助图像;
根据所述第二目标函数和所述标记后的辅助图像构建关于所述原始图像中目标像素的透明度的第一目标函数:
J(α)=αTLα+λ(α-bs)TDs(α-bs)。
结合第一方面、第一方面的第一种至第一方面的第六种任一种可能的实现方式,在第一方面的第七种可能的实现方式中,所述根据所述第一目标函数获得所述原始图像中目标像素的透明度值α之前,还包括:
根据所述第一目标函数获得alpha图像:(L+λDs)α=λbs。
第二方面,本发明实施例提供一种基于透明度的抠图装置,包括:
检测模块,用于获取待抠图的原始图像,对所述原始图像进行边缘检测,获得检测结果;
处理模块,用于根据所述检测结果将全局像素或局部像素作为所述原始图像中目标像素的邻居像素;其中,所述全局像素为在原始图像中根据全局搜索算法获得的像素,所述局部像素为在原始图像中根据局部搜索算法获得的像素;
第一获取模块,用于根据所述原始图像和所述邻居像素获得所述原始图像中的目标像素的透明度值α,根据所述透明度值,在所述原始图像中抠出目标物体。
结合第二方面,在第二方面的第一种可能的实现方式中,所述检测模块包括:
获取单元,用于将所述原始图像转换成灰度图像,对所述灰度图像进行拉普拉斯滤波和均值滤波处理,获得边缘检测图像。
结合第二方面、第二方面的第一种可能的实现方式,在第二方面的第二种可能的实现方式中,所述处理模块还包括:
判断单元,用于判断所述边缘检测图像中目标像素的像素值是否大于预设阈值;其中,所述边缘检测图像中的目标像素与所述原始图像中的目标像素相对应;
若是,则采用全局像素作为所述原始图像中的目标像素的邻居像素;
若否,则采用局部像素作为所述原始图像中的目标像素的邻居像素。
结合第二方面、第二方面的第一种可能的实现方式,在第二方面的第三种可能的实现方式中,所述处理模块还包括:
确定单元,用于在所述原始图像中的目标像素的多个邻居像素中,确定第一预设数目的邻居像素为局部像素,第二预设数目的邻居像素为全局像素。
结合第二方面、第二方面的第一种至第二方面的第三种任一种可能的实现方式,在第二方面的第四种可能的实现方式中,所述第一获取模块包括:
拉普拉斯矩阵L获取单元,用于根据所述原始图像和所述邻居像素获得拉普拉斯矩阵L;
第一目标函数获取单元,用于根据拉普拉斯矩阵L和获取的辅助图像构建关于目标像素的透明度的第一目标函数:J(α)=αTLα+λ(α-bs)TDs(α-bs);其中,α为透明度值,λ为预设参数,Ds为N*N的矩阵,N为所述辅助图像中像素的个数,bs为N*1的向量,N为大于0的整数;
透明度值获取单元,用于根据所述第一目标函数获得所述目标像素的透明度值α。
结合第二方面的第四种可能的实现方式,在第二方面的第五种可能的实现方式中,所述拉普拉斯矩阵L获取单元,具体用于:
根据公式(1)计算邻接矩阵W:
其中,I为所述原始图像,k为所述目标像素,i和j为所述邻居像素集合中两个不同的像素点,Nk为所述邻居像素的集合,uk为所述邻居像素集合中所有像素的均值,Σk为所述邻居像素集合中所有像素的协方差矩阵;
根据公式(2)计算获得拉普拉斯矩阵L:
L=D-W(2)
其中,D为度矩阵,通过公式Dii=ΣjWij获得。
结合第二方面、第二方面的第一种至第二方面的第五种任一种可能的实现方式,在第二方面的第六种可能的实现方式中,所述第一目标函数获取单元,具体用于:
根据所述拉普拉斯矩阵L构建关于所述原始图像中目标像素的透明度的第二目标函数:
f(α)=αTLα;
获取所述辅助图像,并将所述辅助图像的背景用黑色进行标记,前景用白色进行标记,其它部分用灰色进行标记,以获取标记后的辅助图像;
根据所述第二目标函数和所述标记后的辅助图像构建关于所述原始图像中目标像素的透明度的第一目标函数:
J(α)=αTLα+λ(α-bs)TDs(α-bs)。
结合第二方面、第二方面的第一种至第二方面的第六种任一种可能的实现方式,在第二方面的第七种可能的实现方式中,还包括:
alpha图像获取模块,用于根据所述第一目标函数获得alpha图像:(L+λDs)α=λbs。
本发明提供的基于透明度的抠图方法和装置,通过获取待抠图的原始图像,对原始图像进行边缘检测,获得检测结果;根据检测结果将全局像素或局部像素作为原始图像中目标像素的邻居像素,其中,全局像素为在原始图像中根据全局搜索算法获得的像素,局部像素为在原始图像中根据局部搜索算法获得的像素;根据原始图像和邻居像素获得原始图像中目标像素的透明度值α,根据获得的透明度值,在原始图像中抠出目标物体。由于,通过对原始图像进行边缘检测,根据该检测结果选择通过全局搜索方式还是局部搜索的方式来获取原始图像中目标像素的邻居像素,由此可以减小抠图误差,从而提高抠图效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明基于透明度的抠图方法实施例一的流程示意图;
图2为本发明基于透明度的抠图方法实施例二的流程示意图;
图3为本发明基于透明度的抠图方法实施例三的流程示意图;
图4为本发明基于透明度的抠图装置实施例一的结构示意图;
图5为本发明基于透明度的抠图装置实施例二的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明基于透明度的抠图方法实施例一的流程示意图,本发明实施例提供了一种基于透明度的抠图方法,该方法可以由任意执行基于透明度的抠图方法的装置来执行,该装置可以是各种终端设备,例如:个人电脑(personalcomputer;简称PC),手机,PAD,各种服务器等,具体可以通过软件和/或硬件来实现。如图1所示,本实施例的方法可以包括:
步骤101:获取待抠图的原始图像,对原始图像进行边缘检测,获得检测结果。
在本实施例中,对原始图像进行边缘检测处理之后,获得边缘检测图像。本领域技术人员可以理解,该边缘检测图像的特点是:若原始图像中某些边缘部分较复杂,则在边缘检测图像中对应的该边缘部分的像素点偏灰白色;若原始图像中某些区域较光滑,则在边缘检测图像中对应的该部分区域的像素点偏黑色。
步骤102、根据检测结果将全局像素或局部像素作为原始图像中的目标像素的邻居像素;其中,全局像素为在原始图像中根据全局搜索算法获得的像素,局部像素为在原始图像中根据局部搜索算法获得的像素。
在本实施例中,对原始图像进行边缘检测,获得边缘检测图像之后,可以根据边缘检测图像的特点,选择采用全局搜索算法或局部搜索算法,得到全局像素或局部像素作为目标像素的邻居像素。本领域技术人员可以理解,全局搜索算法例如可以是KNN算法,局部搜索算法例如可以是变邻域搜索算法,对于全局搜索算法和局部搜算算法的类型,本实施例对此不作特别限制。
步骤103:根据原始图像和邻居像素获得原始图像中的目标像素的透明度值α,根据透明度值,在原始图像中抠出目标物体。
具体地,根据原始图像和获取的邻居像素,计算获得原始图像中目标像素的透明度值,继而根据获得的透明度值,可以在原始图像中抠出目标物体。例如:在具体的实现过程中,可以利用透明度值α乘以输入图像的方式获得目标物体。对于抠出目标物体的方法,可以根据实际需要选择不同的方法,本实施例对此不作特别限制。
本发明实施例提供的基于透明度的抠图方法,通过获取待抠图的原始图像,对原始图像进行边缘检测,获得检测结果;根据检测结果将全局像素或局部像素作为目标像素的邻居像素,其中,全局像素为在原始图像中根据全局搜索算法获得的像素,局部像素为在原始图像中根据局部搜索算法获得的像素;根据原始图像和邻居像素获得原始图像中目标像素的透明度值α,根据获得的透明度值,在原始图像中抠出目标物体。由于,通过对原始图像进行边缘检测,根据该检测结果选择通过全局搜索方式还是局部搜索方式来获取原始图像中目标像素的邻居像素,由此可以减小抠图误差,从而提高抠图效果。
图2为本发明基于透明度的抠图方法实施例二的流程示意图,本实施例在基于透明度的抠图方法实施例一的基础上,对对原始图像进行边缘检测,并根据检测结果将全局像素或局部像素作为原始图像中的目标像素的邻居像素的实施例,做详细说明。如图2所示,本实施例的方法可以包括:
步骤201、将原始图像转换成灰度图像,对灰度图像进行拉普拉斯滤波和均值滤波处理,获得边缘检测图像。
在本实施例中,对灰度图像进行一次3*3的拉普拉斯滤波,可以得到原始图像的边缘检测结果,具体地,通过对灰度图像和拉普拉斯算子做卷积,即可以得到一幅显示原始图像边缘信息的图像。为了去除检测结果中可能含有的噪声,还可以对获得的边缘检测结果进行一次3*3的均值滤波。
步骤202、判断边缘检测图像中目标像素的像素值是否大于预设阈值;其中,边缘检测图像中的目标像素与原始图像中的目标像素相对应。
在本步骤中,若像素值大于预设阈值,则执行步骤203,否则,执行步骤204。
在本实施例中,预设阈值的大小可以根据实际经验进行选取,例如可以是0.001等,对于预设阈值的具体值的选取,本实施例在此不作特别限制。
另外,将原始图像进行边缘检测处理,获得边缘检测图像之后,原始图像中的目标像素即成为边缘检测图像中的目标像素。通过判断边缘检测图像中目标像素的像素值是否大于预设阈值,根据判断结果选择是在预先定义的特征空间Fs中选取邻居像素,还是在特征空间Ft中选取邻居像素,其中,Fs和Ft分别为:
Fs=[R,G,B,x,y,dR,dG,dB,ctr]
Ft=[R,G,B,x,y,dR,dG,dB]
其中,R为红色,G为绿色,B为蓝色,x为目标像素在原始图像中的横坐标,y为目标像素在原始图像中的纵坐标,dR为红色通道的梯度值,dG为绿色通道的梯度值,dB为蓝色通道的梯度值,ctr为在边缘检测图像中目标像素的像素值。
步骤203、采用全局像素作为原始图像中的目标像素的邻居像素。
在本实施例中,若边缘检测图像中目标像素的像素值大于预设阈值,则表示该目标像素的颜色偏灰白色,说明在原始图像中,该目标像素周围的图像较复杂或可能包含有各种纹理等,此时,需要通过全局搜索算法寻找与目标像素最相似的相关像素作为目标像素的邻居像素,以便更好地对图像进行处理。在本实施例中,以KNN算法为例进行详细说明。
当获取到原始图像后,对原始图像进行边缘检测,获得边缘检测图像中目标像素的像素值,若该像素值大于预设阈值,则使用KNN算法在预先定义的Fs特征空间中对原始图像进行搜索并进行排序,选取前K个像素作为原始图像中目标像素的邻居像素。
步骤204、采用局部像素作为原始图像中的目标像素的邻居像素。
在本实施例中,若边缘检测图像中目标像素的像素值不大于预设阈值,则表示该目标像素的颜色偏黑色,说明在原始图像中该目标像素周围的图像较简单或平滑,此时,认为目标像素周围的像素即为与该目标像素最相似的像素,故通过局部搜索算法选取该目标像素的邻居像素,以更好地对图像进行处理。
具体地,当获取到原始图像后,对原始图像进行边缘检测,获得边缘检测图像中目标像素的像素值,若该像素值小于预设阈值,则在预先定义的Ft特征空间中对原始图像进行搜索,并选取原始图像中目标像素的邻居像素。
本发明实施例提供的基于透明度的抠图方法,通过对原始图像进行边缘检测,并判断边缘检测图像中目标像素的像素值是否大于预设阈值,根据判断结果选取全局像素或者局部像素作为原始图像中目标像素的邻居像素,由此减小了抠图误差,从而提高了抠图的效果。
可选地,如上所述的方法实施例中,在原始图像中的目标像素的多个邻居像素中,也可以确定第一预设数目的邻居像素为局部像素,第二预设数目的邻居像素为全局像素。具体地,对于原始图像中的某个目标像素,可以同时使用局部像素和全局像素作为其邻居像素,例如可以根据实际需要同时选取9个局部像素和9个全局像素作为该目标像素的邻居像素。在具体的实现过程中,可根据经验或者图像某一区域的复杂度选取合适的邻居像素,例如对于相对纹理较多或者较复杂的区域来说,可以选取4个局部像素和14个全局像素作为目标像素的邻居像素;对于相对平滑或者较简单的区域来说,可以选取13个局部像素和5个全局像素作为目标像素的邻居像素。对于第一预设数目和第二预设数目的具体值的选取,本实施例在此不作特别限制。
图3为本发明基于透明度的抠图方法实施例三的流程示意图,本实施例在基于透明度的抠图方法实施例一和基于透明度的抠图方法实施例二的基础上,对根据原始图像和邻居像素获得目标像素的透明度值α的实施例,做详细说明。如图3所示,本实施例的方法可以包括:
步骤301、获取待抠图的原始图像,对原始图像进行边缘检测,获得检测结果。
步骤302、根据检测结果将全局像素或局部像素作为原始图像中的目标像素的邻居像素;其中,全局像素为在原始图像中根据全局搜索算法获得的像素,局部像素为在原始图像中根据局部搜索算法获得的像素。
步骤301-步骤302与步骤101-步骤102类似,此处不再赘述。
步骤303、根据原始图像和邻居像素获得拉普拉斯矩阵L。
在本实施例中,首先根据获取到的原始图像和选取的邻居像素计算获得邻接矩阵,本领域技术人员可以理解,邻接矩阵是表示顶点之间相邻关系的矩阵。在具体的实现过程中,可以根据公式(1)计算获得邻接矩阵W:
其中,I为原始图像,k为目标像素,i和j为邻居像素集合中两个不同的像素点,Nk为邻居像素的集合,uk为邻居像素集合中所有像素的均值,Σk为邻居像素集合中所有像素的协方差矩阵。
获取到邻接矩阵W之后,根据公式(2)可以计算获得拉普拉斯矩阵L:
L=D-W(2)
其中,D为度矩阵,通过公式Dii=ΣjWij获得。
步骤304、根据拉普拉斯矩阵L和获取的辅助图像构建关于原始图像中目标像素的透明度的第一目标函数:J(α)=αTLα+λ(α-bs)TDs(α-bs);其中,α为透明度值,λ为预设参数,Ds为N*N的矩阵,N为辅助图像中像素的个数,bs为N*1的向量,N为大于0的整数。
在本实施例中,首先,根据获得的拉普拉斯矩阵L构建关于目标像素的透明度的第二目标函数:
f(α)=αTLα。
其次,获取由用户提供的带有辅助标记的辅助图像,该辅助图像是一幅灰度图像,是对原始图像的一种粗略的划分,即将原始图像划分为前景、背景和未知区域,其目的是用于提供关于原始图像中前景和背景基本信息的一些先验知识。其中,辅助图像的背景用黑色进行标记,前景用白色进行标记,其它部分用灰色进行标记。
最后,根据构建的第二目标函数和标记后的辅助图像构建关于原始图像中目标像素的透明度的第一目标函数:
J(α)=αTLα+λ(α-bs)TDs(α-bs)。
其中,第一目标函数中的λ是用于平衡αTLα和(α-bs)TDs(α-bs)的参数,本实施例中λ的值可以根据实际需要选取1000或1500等。在具体的实现过程中,可根据经验选取合适的λ值,对于λ的具体值的选取,本实施例在此不作特别限制。Ds是一个N*N的矩阵,矩阵中只有0和1,其中,0代表辅助图像中未知区域的像素点,1代表辅助图像中背景和前景的像素点。bs是一个N*1的向量,向量中也只包含0和1,其中,0代表辅助图像中背景的像素点,1代表辅助图像中前景的像素点。
在构建出关于目标像素的透明度的第一目标函数J(α)=αTLα+λ(α-bs)TDs(α-bs)之后,为使第一目标函数值最小,可以将第一目标函数转化为方程经过计算获得alpha图像(L+λDs)α=λbs。
步骤305、根据第一目标函数获得原始图像中的目标像素的透明度值α。
具体地,可以根据第一目标函数获得alpha图像(L+λDs)α=λbs,其中,Ds是一个只包含有0和1的N*N的矩阵,其中,0代表辅助图像中为未知区域的像素点,1代表辅助图像中为背景和前景的像素点。bs为只包含0和1的N*1的向量,其中,0代表辅助图像中为背景的像素点,1代表辅助图像中为前景的像素点,故通过求解(L+λDs)α=λbs方程,即可获得目标像素的透明度值α,根据得到的透明度值,继而可以在原始图像中抠出目标物体。
本发明实施例提供的基于透明度的抠图方法,通过获取待抠图的原始图像,对原始图像进行边缘检测,获得检测结果;根据检测结果将全局像素或局部像素作为原始图像中的目标像素的邻居像素,其中,全局像素为在原始图像中根据全局搜索算法获得的像素,局部像素为在原始图像中根据局部搜索算法获得的像素;根据原始图像和邻居像素获得拉普拉斯矩阵L,根据拉普拉斯矩阵L和获取的辅助图像构建关于目标像素的透明度的第一目标函数:J(α)=αTLα+λ(α-bs)TDs(α-bs),继而获得目标像素的透明度值α,通过获得的透明度值,在原始图像中抠出目标物体。通过对原始图像进行边缘检测,根据该检测结果选取原始图像中目标像素的邻居像素是全局像素还是局部像素,由此可以减小抠图误差,提高抠图效果。另外,通过构建拉普拉斯矩阵L和第一目标函数计算获得目标像素的透明度值α,可以简化透明度值的计算,同时提高计算的准确度。
可选地,如上所述的方法实施例中,在构建拉普拉斯矩阵L时,也可以先根据实际需要设计邻接矩阵W,其设计的原则是:原始图像中越相似的两个像素,在邻接矩阵W中的数值越大,而越无关的像素,在邻接矩阵W中的数值越小,根据设计的邻接矩阵W来构建拉普拉斯矩阵L。
图4为本发明基于透明度的抠图装置实施例一的结构示意图,如图4所示,本发明实施例提供的基于透明度的抠图装置包括检测模块401,处理模块402和第一获取模块403。
其中,检测模块401用于获取待抠图的原始图像,对所述原始图像进行边缘检测,获得检测结果;处理模块402用于根据所述检测结果将全局像素或局部像素作为所述原始图像中的目标像素的邻居像素;其中,所述全局像素为在原始图像中根据全局搜索算法获得的像素,所述局部像素为在原始图像中根据局部搜索算法获得的像素;第一获取模块403用于根据所述原始图像和所述邻居像素获得所述原始图像中的目标像素的透明度值α,根据所述透明度值,在所述原始图像中抠出目标物体。
本实施例的基于透明度的抠图装置,可以用于基于透明度的抠图方法实施例一的技术方案,其实现原理和技术效果类似,此处不再赘述。
图5为本发明基于透明度的抠图装置实施例二的结构示意图,如图5所示,本实施例在图4所示实施例的基础上,所述检测模块401包括:
获取单元4011,用于将所述原始图像转换成灰度图像,对所述灰度图像进行拉普拉斯滤波和均值滤波处理,获得边缘检测图像。
可选地,所述处理模块402包括:
判断单元4021,用于判断所述边缘检测图像中目标像素的像素值是否大于预设阈值;
若是,则采用全局像素作为所述原始图像中的目标像素的邻居像素;
若否,则采用局部像素作为所述原始图像中的目标像素的邻居像素。
可选地,所述处理模块402还包括:
确定单元4022,用于在所述原始图像中的目标像素的多个邻居像素中,确定第一预设数目的邻居像素为局部像素,第二预设数目的邻居像素为全局像素。
可选地,所述第一获取模块403包括:
拉普拉斯矩阵L获取单元4031用于根据所述原始图像和所述邻居像素获得拉普拉斯矩阵L;第一目标函数获取单元4032用于根据拉普拉斯矩阵L和获取的辅助图像构建关于目标像素的透明度的第一目标函数:J(α)=αTLα+λ(α-bs)TDs(α-bs);其中,α为透明度值,λ为预设参数,Ds为N*N的矩阵,N为所述辅助图像中像素的个数,bs为N*1的向量,N为大于0的整数;透明度值获取单元4033用于根据所述第一目标函数获得所述目标像素的透明度值α。
可选地,所述拉普拉斯矩阵L获取单元4031,具体用于:
根据公式(1)计算邻接矩阵W:
其中,I为所述原始图像,k为所述目标像素,i和j为所述邻居像素集合中两个不同的像素点,Nk为所述邻居像素的集合,uk为所述邻居像素集合中所有像素的均值,Σk为所述邻居像素集合中所有像素的协方差矩阵;
根据公式(2)计算获得拉普拉斯矩阵L:
L=D-W(2)
其中,D为度矩阵,通过公式Dii=ΣjWij获得。
可选地,所述第一目标函数获取单元4032,具体用于:
根据所述拉普拉斯矩阵L构建关于所述原始图像中目标像素的透明度的第二目标函数:
f(α)=αTLα;
获取所述辅助图像,并将所述辅助图像的背景用黑色进行标记,前景用白色进行标记,其它部分用灰色进行标记,以获取标记后的辅助图像;
根据所述第二目标函数和所述标记后的辅助图像构建关于所述所述原始图像中目标像素的透明度的第一目标函数:
J(α)=αTLα+λ(α-bs)TDs(α-bs)。
可选地,所述装置还包括:
alpha图像获取模块404,用于根据所述第一目标函数获得alpha图像:(L+λDs)α=λbs。
本实施例的基于透明度的抠图装置,可以用于执行本发明任意实施例所提供的基于透明度的抠图方法的技术方案,其实现原理和技术效果类似,此处不再赘述。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (16)
1.一种基于透明度的抠图方法,其特征在于,包括:
获取待抠图的原始图像,对所述原始图像进行边缘检测,获得检测结果;
根据所述检测结果将全局像素或局部像素作为所述原始图像中的目标像素的邻居像素;其中,所述全局像素为在原始图像中根据全局搜索算法获得的像素,所述局部像素为在原始图像中根据局部搜索算法获得的像素;
根据所述原始图像和所述邻居像素获得所述原始图像中的目标像素的透明度值α,根据所述透明度值,在所述原始图像中抠出目标物体。
2.根据权利要求1所述的方法,其特征在于,所述对所述原始图像进行边缘检测,具体包括:
将所述原始图像转换成灰度图像,对所述灰度图像进行拉普拉斯滤波和均值滤波处理,获得边缘检测图像。
3.根据权利要求1或2所述的方法,其特征在于,所述根据所述检测结果将全局像素或局部像素作为所述原始图像中的目标像素的邻居像素,具体包括:
判断所述边缘检测图像中目标像素的像素值是否大于预设阈值;其中,所述边缘检测图像中的目标像素与所述原始图像中的目标像素相对应;
若是,则采用全局像素作为所述原始图像中的目标像素的邻居像素;
若否,则采用局部像素作为所述原始图像中的目标像素的邻居像素。
4.根据权利要求1或2所述的方法,其特征在于,所述根据所述检测结果将全局像素或局部像素作为原始图像中的目标像素的邻居像素,具体包括:
在所述原始图像中的目标像素的多个邻居像素中,确定第一预设数目的邻居像素为局部像素,第二预设数目的邻居像素为全局像素。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述根据所述原始图像和所述邻居像素获得所述原始图像中的目标像素的透明度值α,具体包括:
根据所述原始图像和所述邻居像素获得拉普拉斯矩阵L;
根据所述拉普拉斯矩阵L和获取的辅助图像构建关于所述原始图像中目标像素的透明度的第一目标函数:J(α)=αTLα+λ(α-bs)TDs(α-bs);其中,α为透明度值,λ为预设参数,Ds为N*N的矩阵,N为所述辅助图像中像素的个数,bs为N*1的向量,N为大于0的整数;
根据所述第一目标函数获得所述原始图像中的目标像素的透明度值α。
6.根据权利要求5所述的方法,其特征在于,所述根据所述原始图像和所述邻居像素获得拉普拉斯矩阵L,具体包括:
根据公式(1)计算邻接矩阵W:
其中,I为所述原始图像,k为所述目标像素,i和j为所述邻居像素集合中两个不同的像素点,Nk为所述邻居像素的集合,uk为所述邻居像素集合中所有像素的均值,Σk为所述邻居像素集合中所有像素的协方差矩阵;
根据公式(2)计算获得拉普拉斯矩阵L:
L=D-W(2)
其中,D为度矩阵,通过公式Dii=ΣjWij获得。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述根据所述拉普拉斯矩阵L和获取的辅助图像构建关于所述原始图像中目标像素的透明度的第一目标函数:J(α)=αTLα+λ(α-bs)TDs(α-bs),具体包括:
根据所述拉普拉斯矩阵L构建关于所述原始图像中目标像素的透明度的第二目标函数:
f(α)=αTLα;
获取所述辅助图像,并将所述辅助图像的背景用黑色进行标记,前景用白色进行标记,其它部分用灰色进行标记,以获取标记后的辅助图像;
根据所述第二目标函数和所述标记后的辅助图像构建关于所述原始图像中目标像素的透明度的第一目标函数:
J(α)=αTLα+λ(α-bs)TDs(α-bs)。
8.根据权利要求1-7任一项所述的方法,其特征在于,所述根据所述第一目标函数获得所述原始图像中目标像素的透明度值α之前,还包括:
根据所述第一目标函数获得alpha图像:(L+λDs)α=λbs。
9.一种基于透明度的抠图装置,其特征在于,包括:
检测模块,用于获取待抠图的原始图像,对所述原始图像进行边缘检测,获得检测结果;
处理模块,用于根据所述检测结果将全局像素或局部像素作为所述原始图像中的目标像素的邻居像素;其中,所述全局像素为在原始图像中根据全局搜索算法获得的像素,所述局部像素为在原始图像中根据局部搜索算法获得的像素;
第一获取模块,用于根据所述原始图像和所述邻居像素获得所述原始图像中的目标像素的透明度值α,根据所述透明度值,在所述原始图像中抠出目标物体。
10.根据权利要求9所述的装置,其特征在于,所述检测模块包括:
获取单元,用于将所述原始图像转换成灰度图像,对所述灰度图像进行拉普拉斯滤波和均值滤波处理,获得边缘检测图像。
11.根据权利要求9或10所述的装置,其特征在于,所述处理模块包括:
判断单元,用于判断所述边缘检测图像中目标像素的像素值是否大于预设阈值;其中,所述边缘检测图像中的目标像素与所述原始图像中的目标像素相对应;
若是,则采用全局像素作为所述原始图像中的目标像素的邻居像素;
若否,则采用局部像素作为所述原始图像中的目标像素的邻居像素。
12.根据权利要求9或10所述的装置,其特征在于,所述处理模块还包括:
确定单元,用于在所述原始图像中的目标像素的多个邻居像素中,确定第一预设数目的邻居像素为局部像素,第二预设数目的邻居像素为全局像素。
13.根据权利要求9-12任一项所述的装置,其特征在于,所述第一获取模块包括:
拉普拉斯矩阵L获取单元,用于根据所述原始图像和所述邻居像素获得拉普拉斯矩阵L;
第一目标函数获取单元,用于根据拉普拉斯矩阵L和获取的辅助图像构建关于目标像素的透明度的第一目标函数:J(α)=αTLα+λ(α-bs)TDs(α-bs);其中,α为透明度值,λ为预设参数,Ds为N*N的矩阵,N为所述辅助图像中像素的个数,bs为N*1的向量,N为大于0的整数;
透明度值获取单元,用于根据所述第一目标函数获得所述目标像素的透明度值α。
14.根据权利要求13所述的装置,其特征在于,所述拉普拉斯矩阵L获取单元,具体用于:
根据公式(1)计算邻接矩阵W:
其中,I为所述原始图像,k为所述目标像素,i和j为所述邻居像素集合中两个不同的像素点,Nk为所述邻居像素的集合,uk为所述邻居像素集合中所有像素的均值,Σk为所述邻居像素集合中所有像素的协方差矩阵;
根据公式(2)计算获得拉普拉斯矩阵L:
L=D-W(2)
其中,D为度矩阵,通过公式Dii=ΣjWij获得。
15.根据权利要求9-14任一项所述的装置,其特征在于,所述第一目标函数获取单元,具体用于:
根据所述拉普拉斯矩阵L构建关于所述原始图像中目标像素的透明度的第二目标函数:
f(α)=αTLα;
获取所述辅助图像,并将所述辅助图像的背景用黑色进行标记,前景用白色进行标记,其它部分用灰色进行标记,以获取标记后的辅助图像;
根据所述第二目标函数和所述标记后的辅助图像构建关于所述原始图像中目标像素的透明度的第一目标函数:
J(α)=αTLα+λ(α-bs)TDs(α-bs)。
16.根据权利要求9-15任一项所述的装置,其特征在于,还包括:
alpha图像获取模块,用于根据所述第一目标函数获得alpha图像:(L+λDs)α=λbs。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410568214.9A CN105590307A (zh) | 2014-10-22 | 2014-10-22 | 基于透明度的抠图方法和装置 |
PCT/CN2015/092537 WO2016062259A1 (zh) | 2014-10-22 | 2015-10-22 | 基于透明度的抠图方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410568214.9A CN105590307A (zh) | 2014-10-22 | 2014-10-22 | 基于透明度的抠图方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105590307A true CN105590307A (zh) | 2016-05-18 |
Family
ID=55760310
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410568214.9A Pending CN105590307A (zh) | 2014-10-22 | 2014-10-22 | 基于透明度的抠图方法和装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN105590307A (zh) |
WO (1) | WO2016062259A1 (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018107825A1 (zh) * | 2016-12-13 | 2018-06-21 | 华为技术有限公司 | 抠图方法及装置 |
CN110111342A (zh) * | 2019-04-30 | 2019-08-09 | 贵州民族大学 | 一种抠图算法的优化选取方法及装置 |
CN110298833A (zh) * | 2019-06-28 | 2019-10-01 | 百度在线网络技术(北京)有限公司 | 图片处理方法和装置 |
WO2020062899A1 (zh) * | 2018-09-26 | 2020-04-02 | 惠州学院 | 通过前景背景像素对和灰度信息获得透明度遮罩的方法 |
CN112150348A (zh) * | 2020-08-13 | 2020-12-29 | 北京旷视科技有限公司 | 试妆及试妆部件模板的生成方法、装置、设备及存储介质 |
CN112399196A (zh) * | 2019-08-16 | 2021-02-23 | 阿里巴巴集团控股有限公司 | 图像处理方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1445984A (zh) * | 2003-04-14 | 2003-10-01 | 浙江大学 | 数字图像处理中以任意图像为背景的快速抠图方法 |
CN102567727A (zh) * | 2010-12-13 | 2012-07-11 | 中兴通讯股份有限公司 | 一种背景目标替换方法和装置 |
CN102842119A (zh) * | 2012-08-18 | 2012-12-26 | 湖南大学 | 一种基于抠像和边缘增强的快速文本图像超分辨率方法 |
CN102902956A (zh) * | 2012-09-10 | 2013-01-30 | 中国人民解放军理工大学气象学院 | 一种地基可见光云图识别处理方法 |
US20130051663A1 (en) * | 2011-08-26 | 2013-02-28 | Aravind Krishnaswamy | Fast Adaptive Edge-Aware Matting |
-
2014
- 2014-10-22 CN CN201410568214.9A patent/CN105590307A/zh active Pending
-
2015
- 2015-10-22 WO PCT/CN2015/092537 patent/WO2016062259A1/zh active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1445984A (zh) * | 2003-04-14 | 2003-10-01 | 浙江大学 | 数字图像处理中以任意图像为背景的快速抠图方法 |
CN102567727A (zh) * | 2010-12-13 | 2012-07-11 | 中兴通讯股份有限公司 | 一种背景目标替换方法和装置 |
US20130051663A1 (en) * | 2011-08-26 | 2013-02-28 | Aravind Krishnaswamy | Fast Adaptive Edge-Aware Matting |
CN102842119A (zh) * | 2012-08-18 | 2012-12-26 | 湖南大学 | 一种基于抠像和边缘增强的快速文本图像超分辨率方法 |
CN102902956A (zh) * | 2012-09-10 | 2013-01-30 | 中国人民解放军理工大学气象学院 | 一种地基可见光云图识别处理方法 |
Non-Patent Citations (3)
Title |
---|
HAIYAN YANG 等: "A COMPREHENSIVE STUDY ON DIGITAL IMAGE MATTING", 《SIGNAL AND INFORMATION PROCESSING (CHINASIP)》 * |
XIAOWU CHEN 等: "Image Matting with Local and Nonlocal Smooth Priors", 《2013 IEEE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION》 * |
姚桂林: "数字图像抠图关键技术研究", 《中国博士学位论文全文数据库 信息科技辑》 * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018107825A1 (zh) * | 2016-12-13 | 2018-06-21 | 华为技术有限公司 | 抠图方法及装置 |
CN108460770A (zh) * | 2016-12-13 | 2018-08-28 | 华为技术有限公司 | 抠图方法及装置 |
CN108460770B (zh) * | 2016-12-13 | 2020-03-10 | 华为技术有限公司 | 抠图方法及装置 |
WO2020062899A1 (zh) * | 2018-09-26 | 2020-04-02 | 惠州学院 | 通过前景背景像素对和灰度信息获得透明度遮罩的方法 |
CN110111342A (zh) * | 2019-04-30 | 2019-08-09 | 贵州民族大学 | 一种抠图算法的优化选取方法及装置 |
CN110111342B (zh) * | 2019-04-30 | 2021-06-29 | 贵州民族大学 | 一种抠图算法的优化选取方法及装置 |
CN110298833A (zh) * | 2019-06-28 | 2019-10-01 | 百度在线网络技术(北京)有限公司 | 图片处理方法和装置 |
CN110298833B (zh) * | 2019-06-28 | 2021-08-31 | 百度在线网络技术(北京)有限公司 | 图片处理方法和装置 |
CN112399196A (zh) * | 2019-08-16 | 2021-02-23 | 阿里巴巴集团控股有限公司 | 图像处理方法及装置 |
CN112150348A (zh) * | 2020-08-13 | 2020-12-29 | 北京旷视科技有限公司 | 试妆及试妆部件模板的生成方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2016062259A1 (zh) | 2016-04-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105590307A (zh) | 基于透明度的抠图方法和装置 | |
CN108389224B (zh) | 图像处理方法及装置、电子设备和存储介质 | |
US7305127B2 (en) | Detection and manipulation of shadows in an image or series of images | |
US11443436B2 (en) | Interactive image matting method, computer readable memory medium, and computer device | |
EP3133552A2 (en) | Denoising filter | |
US20090245651A1 (en) | System and method for identifying complex tokens in an image | |
US20120141014A1 (en) | Color balancing for partially overlapping images | |
JP2004536518A (ja) | デモザイク処理プロセスにおけるバイラテラルフィルタリング | |
CN104053984A (zh) | 图像检查方法和图像检查装置 | |
CN101246593B (zh) | 一种彩色图像边缘检测方法及设备 | |
US8385655B2 (en) | Method and system for generating intrinsic images using single reflectance technique | |
CN104637046A (zh) | 图像检测方法和装置 | |
CN110910445B (zh) | 一种物件尺寸检测方法、装置、检测设备及存储介质 | |
JP2013105245A (ja) | 画像処理方法、装置及びプログラム | |
Gong et al. | User-assisted image shadow removal | |
CN110705634A (zh) | 一种鞋跟型号识别方法、装置及存储介质 | |
US10521918B2 (en) | Method and device for filtering texture, using patch shift | |
Duran et al. | A demosaicking algorithm with adaptive inter-channel correlation | |
CN106415596B (zh) | 基于分割的图像变换 | |
Zhang et al. | Single image dehazing using fixed points and nearest-neighbor regularization | |
CN106469432A (zh) | 对象提取方法和对象提取设备 | |
CN109060830A (zh) | 显示屏的杂质的检测方法和装置 | |
US8428352B1 (en) | Post processing for improved generation of intrinsic images | |
Hu et al. | Jpeg ringing artifact visibility evaluation | |
CN106462966B (zh) | 用于识别图像中的色块区的方法和图像处理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20160518 |