基于内容的图像检索软件库LIRE的特征提取方法综述_lucene image retrieval-程序员宅基地

技术标签: FCTH  Java编程  LIRE  图像检索  CBIR  CEDD  

LIRE(Lucene Image Retrieval ) 是利用Apache Lucene 建立索引进行图像检索的开源软件库。该软件项目的网址是 http://lire-project.net。LIRE这个软件库可以很方便地建立Lucene索引进行基于内容的图像检索 (CBIR, content based image retrieval ),该库为检索提供了丰富的图像特征提取方法。这里提醒大家一下,如果使用LIRE时你要用Lucene 建立索引,请注意Lucene版本兼容问题。本文对LIRE 特征提取方法做简介,不介绍LIRE其他方面。

 

1 全局特征

LIRE源码解压后,在src\main\java\net\semanticmetadata\lire\imageanalysis\features路径下有global文件夹,里面有20个全局特征提取方法。

 

1.1 ACCID

ACCID特征的目的是寻找不同尺度下最重要的边缘特征,然后把它们和使用 CEDD描述子得到的模糊色彩方案一起储存在一个直方图里。

1.2 AutoColorCorrelogram

AutoCorrelogram特征基于颜色,算法参考Huang, J.; Kumar, S. R.; Mitra, M.; Zhu, W. & Zabih, R. (2007) "Image Indexing Using Color Correlograms", IEEE Computer Society. DOI: 10.1109/CVPR.1997.609412。一个颜色相关图(color correlogram) 是一个用颜色和像素间距离建立索引的三维数据表。它代表了一个图像中,颜色改变的空间相关性是如何随距离变化的。

1.3 BinaryPatternsPyramid

BinaryPatternsPyramid和PHOG一样,但PHOG是以方向渐变来量度,而这里用的是旋转不变性的局部二值模式(LBP, Local binary patterns)的直方图。

1.4 CEDD

 CEDD是颜色和边缘方向性描述子,将图像的颜色和边缘方向性信息结合起来生成一个144字节的直方图。关于CEDD的更多知识可以参考 Savvas A. Chatzichristofis and Yiannis S. Boutalis, CEDD: Color and Edge Directivity Descriptor. A Compact Descriptor for Image Indexing and Retrieval, A. Gasteratos, M. Vincze, and J.K. Tsotsos (Eds.): ICVS 2008, LNCS 5008, pp. 312-322, 2008.

1.5 ColorLayout

ColorLayout是MPEG-7多媒体标准描述子中一种高效的颜色特征描述子。通过图像分割、代表颜色选择、离散余弦变换(DCT, Discrete Cosine Transform)、Z字形扫描四个步骤得到特征描述子。(用于CEDD)

1.6 EdgeHistogram

EdgeHistogram是MPEG-7多媒体标准描述子中一种高效的边缘特征描述子。用一个40个字节的数组构成一个边缘直方图描述子。通过图像分割、计算子图边缘直方图、归一化、计算图像边缘直方图等步骤得到特征描述子。(用于CEDD)

1.7 FCTH

FCTH是模糊颜色和纹理直方图特征。它从3个模糊单元的组合求得。先将图像分割,然后用两个模糊单元产生模糊颜色直方图,再在第三个模糊单元中将子图经小波变换生成模糊纹理直方图,最后模糊颜色直方图和模糊纹理直方图结合得到FCTH特征描述子。更多信息请参考:Savvas A. Chatzichristofis and Yiannis S. Boutalis, FCTH: Fuzzy Color and Texture Histogram - A Low Level Feature for Accurate Image Retrieval, in Proceedings of the Ninth International Workshop on Image Analysis for Multimedia Interactive Services, IEEE, Klagenfurt, May, 2008.

1.8 FuzzyColorHistogram 

FuzzyColorHistogram是一种模糊颜色直方图特征。传统颜色直方图对噪音敏感。模糊颜色直方图通过模糊算法产生模糊颜色直方图。

1.9 FuzzyOpponentHistogram

 FuzzyOpponentHistogram是基于对色(对手颜色)空间的简单的模糊64-bin(维)对色直方图。更多信息参考Sande K E A V D , Gevers T , Snoek C G M . Evaluating color descriptors for object and scene recognition. IEEE Trans Pattern Anal Mach Intell[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2010, 32(9):1582-1596.

1.10 Gabor

Gabor纹理特征通过对图像与gabor滤波器做卷积而得到,gabor滤波器定义为高斯函数与正弦函数的乘积。Gabor特征提取模拟了人类视觉刺激响应,广泛应用于视觉信息理解,例如人脸识别。

1.11 JCD

 JCD特征将CEDD和FCTH结合在一个直方图里面。

1.12 JpegCoefficientHistogram

JpegCoefficientHistogram是JPEG 系数直方图特征。将图像分块,然后求离散余弦变换(DCT,Discrete Cosine Transform。JPEG图像压缩时要做DCT变换),计算DCT系数矩阵,再从得到的差分DCT系数矩阵求得直方图。适用于JPEG图像检索。

1.13 LocalBinaryPatterns

LocalBinaryPatterns是原始的局部二值模式特征。在图像每个3*3像素块中,以中心像素为阈值,将相邻的8个像素的灰度值与其进行比较,大于中心像素值的像素点标记为1,反之为0,中心点周围8个点经比较产生8位二进制数,将其转换为十进制数作为中心像素点的LBP值,以此来反映该区域的纹理信息。

1.14 LuminanceLayout

LuminanceLayout描述子用于灰度或黑白图像。它将图像缩小到很小然后将它作为描述子。

1.15 OpponentHistogram

简单的64-bin(维)对色直方图,基于对色空间。参见1.9。

1.16 PHOG

PHOG描述子大体上就是将几个空间金字塔中不同层(可理解为图像缩小到不同分辨率)的边缘直方图结合在一起。更多信息参考 Anna Bosch, Andrew Zisserman & Xavier Munoz (2007) "Representing shape with a spatial pyramid kernel", CVIR 2007.

1.17 RotationInvariantLocalBinaryPatterns

一个简单的具有旋转不变性的局部二值模式特征。

1.18 ScalableColor

ScalableColor是MPEG-7 Scalable Color使用LireFeature的一个打包。可伸缩颜色描述符(Scalable Color Descriptor)是MPEG-7标准中颜色描述符的一种。它是固定于HSV空间的颜色直方图,用Haar变化编码,针对不同需求可改变尺寸。更多信息可参考:李志全, 黎建辉, 阎保平. MPEG-7可伸缩颜色描述符的研究[J]. 中国科学院大学学报, 2006, 23(2):192-197.

1.19 SimpleColorHistogram

SimpleColorHistogram提供一个简单的RGB颜色直方图,用于基于内容的图像检索。在LIRE的SimpleColorHistogram中,维数是可配置的,直方图归一化到每维8位。

1.20 Tamura

Tamura特征由Tamura提出,用粗糙度、对比度、方向度、 线像度、规整度和粗略度六个分量对应于心理学角度上纹理特征的六种属性。前三种最重要,所以LIRE的Tamura特征用前三个分量来实现。

 

2 局部特征

LIRE局部特征描述子包括:Simple、SelfSimilarities、Shapecontext、Sift、Surf。源码在src\main\java\net\semanticmetadata\lire\imageanalysis\features路径下local文件夹中。

2.1 Simple

Simple特征基于论文:Anagnostopoulos N , Boutalis Y , Kapoutsis A C , et al. Searching Images with MPEG-7 (& MPEG-7-like) Powered Localized dEscriptors: The SIMPLE answer to effective Content Based Image Retrieval[C]// International Workshop on Content-based Multimedia Indexing. IEEE, 2014。论文中,作者使用SURF检测子定义团状纹理突出部分,用MPEG-7 可伸缩颜色 Scalable Color ,颜色布局Color Layout以及边缘直方图Edge Histogram描述子以及CEDD来产生最终的局部特征描述子。

2.2 SelfSimilarities

SelfSimilarities特征基于论文:Chatfield K , Philbin J , Zisserman A . Efficient retrieval of deformable shape classes using local self-similarities[C]// IEEE International Conference on Computer Vision Workshops. IEEE Xplore, 2009。论文中,作者表示该特征描述子可用于快速检索图像,即使目标图像中物体缩放、图像颜色纹理发生变化、位置变化。此外,该特征对物体非刚性变形的鲁棒性也很好。

2.3 Shapecontext

Shapecontext特征基于论文: S. Belongie, J. Malik, and J. Puzicha, "Shape Matching and Object Recognition Using Shape Contexts," IEEE Trans. Pattern Analysis and Machine Intelligence, vol. 24, no. 4, pp. 509-522, Apr. 2002。论文作者用新方法测量形状之间的相似性并将其用于物体识别。在该框架中,形状相似性量度通过两个步骤进行1)求两个形状间对应点;2)用这些对应来估算对准后的形变。为解决对应的问题,设计了shape context(形状上下文)描述子。这个shape context是一个参考点,它是周围余下点相对于它的分布。相对应的点会有近似的shape context。这样,两个相似的形状的对应点会有相似的shape context。

2.4 Sift

Sift是尺度不变特征变换(Scale-invariant feature transform)。它用不同尺度(标准差)的高斯函数对图像进行平滑,平滑后图像变化差别大的像素就是特征明显的点。 它对旋转、缩放、亮度变化保持不变性,对视角变化、仿射变换、噪声也保持一定程度的鲁棒性。网上资料较多,大家也比较熟悉,这里不多说了。

2.3 Surf

Surf (Speeded Up Robust Features) 比SIFT要快数倍,而且其作者声称在不同图像变换方面比Sift更加稳健。Hessian矩阵是SURF算法的核心。Surf网上资料也很多,这里不多说了。

3 总结

LIRE提供的特征描述子中,ColorLayout、 ScalableColor是MPEG-7标准中颜色描述子中的其中两种;SimpleColorHistogram是经典的颜色直方图,OpponentHistogram是基于对色空间的直方图;FuzzyColorHistogram、FuzzyOpponentHistogram利用模糊算法处理减少噪音对Color Histogram、Opponent Histogram的干扰。LuminanceLayout是简单快速的明暗特征,AutoColorCorrelogram颜色改变随距离变化的空间相关性特征,这些都是属于图像的颜色特征描述。

EdgeHistogram是基本的边缘直方图特征, LocalBinaryPatterns是原始的局部二值模式特征,RotationInvariantLocalBinaryPatterns是旋转不变的局部二值模式;PHOG是图像不同分辨率下边缘直方图的结合(以方向渐变来量度),BinaryPatternsPyramid与PHOG不同的地方是使用旋转不变性的局部二值模式的直方图。这几个都是图像纹理特征的描述子。

CEDD把图像的颜色和边缘方向性信息结合起来生成直方图。ACCID把不同尺度下最重要的边缘特征,与使用 CEDD描述子得到的模糊色彩方案一起储存在一个直方图里。FCTH是颜色和纹理直方图模糊处理再结合的;JCD则把CEDD和FCTH联合在一起。

JpegCoefficientHistogram是JPEG 系数直方图特征,适用于JPEG压缩的图片。

    Gabor纹理特征模拟了人类视觉刺激响应,广泛应用于视觉信息理解

Tamura用对应于心理学角度上纹理:特征粗糙度、对比度、方向度来进行图像纹理特征描述。

LIRE提供的局部特征描述子中Sift、Surf是最为人所知的。Simple是Surf、Scalable Color、Color Layout、Edge Histogram、CEDD等多种特征的综合。SelfSimilarities和Shapecontext是检测图像局部形状的特征。

LIRE提供的这些特征描述子各具特色,在不同的基于内容的图像检索应用中,需根据具体的需要进行选择,很显然一个基于内容的图像检索如果结合考虑了颜色、纹理和形状特征是会提高精确性的。结合不同特征时还应考虑速度、精确性(precision)和召回率(recall)。即使综合应用多种特征,往往也难以达到很高的精确性。为了提高精确性,可以对大样本提取特征再聚类分析后获取更具代表性的特征用于检索,甚至通过人工神经网(ANN)和支持向量机(SVM)等监督学习方法对大量样本进行训练建模来提高检索的精确性,但这在速度上肯定是收到很大影响的。

 

希望对LIRE了解更多的可以参考以下文献:

  1. Lux Mathias, Savvas A. Chatzichristofis. Lire: Lucene Image Retrieval- An Extensible Java CBIR Library. In proceedings of the 16th ACM International Conference on Multimedia, pp. 1085-1088, Vancouver, Canada, 2008. http://doi.acm.org/10.1145/1459359.1459577

[2]Lux Mathias. Content Based Image Retrieval with LIRE. In proceedings of the 19th ACM International Conference on Multimedia, pp. 735-738, Scottsdale, Arizona, USA, 2011. http://dl.acm.org/citation.cfm?id=2072432

[3]Mathias Lux, Oge Marques. Visual Information Retrieval using Java and LIRE. Morgan & Claypool, 2013. http://www.morganclaypool.com/doi/abs/10.2200/S00468ED1V01Y201301ICR025

 

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/netscaner/article/details/99720381

智能推荐

已解决(selenium操作火狐浏览器报错)TypeError: __init__() got an unexpected keyword argument ‘firefox_options‘-程序员宅基地

文章浏览阅读1.6w次,点赞8次,收藏18次。已解决(selenium操作火狐浏览器报错)TypeError: __init__() got an unexpected keyword argument ‘firefox_options‘_typeerror: __init__() got an unexpected keyword argument 'chrome_options

python方差_Python编程:方差、标准差、均方差、均方根值、均方误差、均方根误差...-程序员宅基地

文章浏览阅读315次。python实现代码# -*- coding: utf-8 -*-import mathdef get_average(records):"""平均值"""return sum(records) / len(records)def get_variance(records):"""方差 反映一个数据集的离散程度"""average = get_average(records)return sum(..._pycharm方差计算代码

jmeter接口测试实例(五)对cookies的自动管理,实现登录后修改用户信息_jmeter中post请求如何更改每次的用户名-程序员宅基地

文章浏览阅读902次。一、前提:cookie是保存在本地,用来记录用户信息,最典型的作用是判断用户是否已经登录。如果一个接口,需要用户登录后,才能进行操作,如下,修改用户信息那么这时候,就需要用到cookie去识别这个登录的用户,因为要修改的是这个登录的用户的信息。二、使用1、jmeter.properties 中 将CookieManager.save.cookies 设置为true。完成后重启jmet..._jmeter中post请求如何更改每次的用户名

python新建项目没有venv_pycharm配置venv虚拟环境-程序员宅基地

文章浏览阅读7.5k次,点赞2次,收藏2次。虚拟环境的好处:搭建独立的python运行环境,不与其他产生冲突虚拟环境有助于包的管理和防止版本冲突3.删除卸载方便虚拟环境的搭建:1.进入python的Scripts下,执行:pip3 install virtualenv2.选择建立虚拟环境的文件夹,我这边是直接在D盘software下面创建了一个virtualenv,如图:image.png3.创建虚拟环境:virtualenv --no-s..._pycharm没有venv怎么办

M1芯片的Mac在开发iOS项目时遇到的问题汇总(模拟器无法运行,Cocoapods错误等)_oc cocospods 安装依赖库之后不能使用模拟器了-程序员宅基地

文章浏览阅读2.3k次。--pod install时报错,且错误提示中有“ffi”字眼,提示错误:/Library/Ruby/Gems/2.6.0/gems/ffi-1.15.3/lib/ffi/library.rb:275: [BUG] Bus Error at 0x00000001042fc000 ruby 2.6.3p62 (2019-04-16 revision 67580) [universal.arm64e-darwin20]解决方案:juejin.cn/post/698064…--pod repo upd_oc cocospods 安装依赖库之后不能使用模拟器了

编辑器VSCode使用心得-程序员宅基地

文章浏览阅读540次。工欲善其事必先利其器,趁手的工具会使我们开发事半功倍。市面上的编辑器我用过许多,编辑器使用经历Notepad++,(开源)这个应该是最轻量级的吧,查看代码还好,编辑代码就算了官网地址:https://notepad-plus-plus.org/Brackets,(开源)这个也不错,github-star:30k了,上次发布版本是6月..._vscode nextick

随便推点

西部数码mysql怎么用织梦_[原创]织梦程序(DeDeCms)常见问题集锦-程序员宅基地

文章浏览阅读95次。前言:织梦程序是最知名的cms程序,使用广泛,但很多朋友对织梦还不太熟悉,通过工单分析得知,经常容易出现本文中的问题,本次统一整理出来,希望对新手朋友有帮助,本文写的非常详细,请仔细阅读,一、描述:“dedecms错误警告:连接数据库失败,可能数据库密码不对或数据库服务器出错”如图:分析:用织梦程序制作的站点做迁移服务器后容易出现这个问题,原因是程序中设置的数据库连接信息有误连接不到数据库,解决方..._西部数码支不支持织梦的程序

免安装mysql启动3534错误处理_mysql 免安装版本启动时 3534出错_mysql-程序员宅基地

文章浏览阅读295次。上午在win7下安装MYSQL,只到“net start mysql”这一步报错:3534的错误:于是在百度中搜索关键字“mysql服务无法启动3534”。参考以下两个链接中的方法,解决了3534启动失败的问题:mysql服务无法启动3534错误。http://jingyan.baidu.com/article/219f4bf7e978fcde442d38a9.htmlhttp://blog.cs..._免安装mysql启动失败

评测了10款画流程图软件,这4款最好用!(完全免费)_好用的流程图软件免费-程序员宅基地

文章浏览阅读5.1w次,点赞58次,收藏295次。最近在做项目和复习的时候,用了不少流程图软件给我帮了大忙,所以今天就来分享分享你在网上搜索一下流程图软件,能找到很多很多:但这些软件多数并不是专门绘制流程图的软件,它可能是一些思维导图软件、或者说一些产品交互原型图软件,使用时或多或少有些麻烦。而且,普遍这些软件缺点也很多,比如:只有在线版:ProcessOn(https://www.processon.com)导出功能收费:迅捷流程图软件体积庞大:VISIO就没有一款简单易用、绿色免费的流程图软件吗?阿虚花了不少时间,挨着_好用的流程图软件免费

在CentOS6.9安装Azkaban3.50.0_centos6.9 azkaban-程序员宅基地

文章浏览阅读1.4k次。cd /data/install_pkgwget https://github.com/azkaban/azkaban/archive/3.50.0.tar.gztar -zxvf 3.50.0.tar.gzvi /data/install_pkg/azkaban-3.50.0/azkaban-common/src/main/java/azkaban/utils/EmailMessage..._centos6.9 azkaban

Java项目基于ssm+vue.js的学生宿舍维修服务平台附带文章和源代码设计说明文档ppt-程序员宅基地

文章浏览阅读586次,点赞23次,收藏30次。博主介绍:CSDN特邀作者、985计算机专业毕业、某互联网大厂高级全栈开发程序员、码云/掘金/华为云/阿里云/InfoQ/StackOverflow/github等平台优质作者、专注于Java、小程序、前端、python等技术领域和毕业项目实战,以及程序定制化开发、全栈讲解、就业辅导、面试辅导、简历修改。精彩专栏 推荐订阅2023-2024年最值得选的微信小程序毕业设计选题大全:100个热门选题推荐2023-2024年最值得选的Java毕业设计选题大全:500个热门选题推荐。

ultralytics的YOLOv8改为自用版本_from ultralytics.utils.plotting import annotator, -程序员宅基地

文章浏览阅读944次。由于需要用pyqt给yolov8做一个界面,而ultralytics一层嵌一层,不是很好用,所以对它的这个源码进行精简,具体代码我放到了这里,ultralytics使用的版本是8.0.54。具体代码如下,需要根据自己的情况来修改data的配置文件以及权值文件,在代码的49和50行。_from ultralytics.utils.plotting import annotator, colors, save_one_box modul

推荐文章

热门文章

相关标签