技术标签: 机器学习 计算机视觉 图像处理 深度学习 目标检测 人工智能
作者简介: CSDN、阿里云人工智能领域博客专家,新星计划计算机视觉导师,百度飞桨PPDE,专注大数据与AI知识分享。公众号:GoAI的学习小屋 ,免费分享书籍、简历、导图等,更有交流群分享宝藏资料,关注公众号回复“加群”或️链接 加群。
AI学习星球推荐: GoAI的学习社区 知识星球是一个致力于提供《机器学习 | 深度学习 | CV | NLP | 大模型 | 多模态 | AIGC 》各个最新AI方向综述、论文等成体系的学习资料,配有全面而有深度的专栏内容,包括不限于 前沿论文解读、资料共享、行业最新动态以、实践教程、求职相关(简历撰写技巧、面经资料与心得)多方面综合学习平台,强烈推荐AI小白及AI爱好者学习,性价比非常高!加入星球️点击链接
说明:本系列深度学习资料集合包含机器学习、深度学习等各系列教程,主要以计算机视觉资料为主,包括图像识别、分类、检测、分割等,内容参考Github及网络资源,仅供个人学习。侵权联系删除!
深度学习定义:一般是指通过训练多层网络结构对未知数据进行分类或回归
深度学习分类:
有监督学习方法——深度前馈网络、卷积神经网络、循环神经网络等;
无监督学习方法——深度信念网、深度玻尔兹曼机,深度自编码器等。
图像分类(物体识别):整幅图像的分类或识别
物体检测:检测图像中物体的位置进而识别物体
图像分割:对图像中的特定物体按边缘进行分割
图像回归:预测图像中物体组成部分的坐标
语音识别:将语音识别为文字
声纹识别:识别是哪个人的声音
语音合成:根据文字合成特定人的语音
语言模型:根据之前词预测下一个单词。
情感分析:分析文本体现的情感(正负向、正负中或多态度类型)。
神经机器翻译:基于统计语言模型的多语种互译。
神经自动摘要:根据文本自动生成摘要。
机器阅读理解:通过阅读文本回答问题、完成选择题或完型填空。
自然语言推理:根据一句话(前提)推理出另一句话(结论)。
图像描述:根据图像给出图像的描述句子
可视问答:根据图像或视频回答问题
图像生成:根据文本描述生成图像
视频生成:根据故事自动生成视频
手写机器学习笔记 github
机器学习算法公式推导以及numpy实现 github
人工智能相关术语 link
周志华《机器学习》手推笔记 github
机器学习算法 基于西瓜书以及《统计学习方法》 github
机器学习与深度学习基础概念介绍 link
怎样写一个深度学习框架 link
深度学习算法地图 link
卷积神经网络的感受野 link
「深」为什么重要,以及还有什么深的网络 link
深度学习入门之激活层及其选择的建议 link
深度学习如何优化神经网络结构|架构 link
深度学习“科学炼丹”手册 link
深度学习训练tricks整理 数据增强等技巧 link
pytorch图卷积库 github
AI模型序列化总结 github
AiLearning 传统机器学习的讲解、分析和代码github
CNN真的需要下采样(上采样)吗? link
构建深度神经网络,我有20条「不成熟」的小建议 link
feature map 相加和拼接的不同 link
你有哪些deep learning(rnn、cnn)调参的经验? link
目标检测的综述 link
常见的模型算法评估指标 link
GAN万字长文综述 link
神经网络压缩综述 link
细粒度图像分析综述 link
人脸识别损失函数综述 link
OCR papernote github
图像分割综述 link
图像内容鉴黄算法综述 link
AI技术三大应用领域:智能医疗、自动驾驶、智慧营销产业发展现状分析 link
深度学习模型在各大公司实际生产环境的应用讲解文章 github
AlexNet
ImageNet Classification with Deep Convolutional Neural Networks
中文版
中英文对照
VGG
Very Deep Convolutional Networks for Large-Scale Image Recognition
中文版
中英文对照
ResNet
Deep Residual Learning for Image Recognition
中文版
中英文对照
GoogLeNet
Going Deeper With Convolutions
中文版
中英文对照
BN-GoogLeNet
Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift
中文版
中英文对照
Inception-v3
Rethinking the Inception Architecture for Computer Vision
中文版
中英文对照
轻量级卷积神经网络的设计技巧 link
MixNet-Pytorch github
ShuffleNet 官方开源github
为什么MobileNet及其变体如此之快 github
dabnn 二值网络 github
神经网络量化简介 github
手机端高性能卷积神经网络推理引擎概览 github
学习参考(强推):link
损失函数技术总结 link
根据标签分布来选择损失函数 link
深度学习多目标优化的多个loss应该如何权衡 link
归一化方法总结 link
Kaggle图像分割比赛中的损失函数及keras实现 link
11个重要的机器学习模型评估指标 link
IQA-optimization 图像质量的损失函数 github
regression-losses-pytorch github
分类回归损失函数汇总 link
Learned Perceptual Image Patch Similarity (LPIPS) metric github
超分损失函数小结 link
DataGene - 识别数据集之间的相似度 github
FAT:一种快速的Triplet Loss近似方法,学习更鲁棒的特征表示,并进行有噪声标签的提纯 link github
用于医学图像分割的损失函数 link
目标检测回归损失函数简介:SmoothL1/IoU/GIoU/DIoU/CIoU Loss [link]
CNN模型合集 link
分类实现合集 pytorch github
让CNN有了平移不变性 link
lottery-ticket-hypothesis github
pytorch_image_classification github
deeplearning-modelsgithub
EfficientNets-PyTorch 2019 github
ML_GCN PyTorch implementation of Multi-Label Image Recognition with Graph Convolutional Networks, CVPR 2019 github
pytorch_highway_networks github
推崇的CNN架构 link
图卷积网络Numpy实现 link
PeleeNet-基于手机系统的实时网络 link
TResNet: High Performance GPU-Dedicated Architecture github
ResNeSt 李沐团队提出最强ResNet改进版,多项任务达到SOTA github
SCNet - PyTorch官方实现CVPR 2020论文“使用自校准卷积改进卷积网络” github
SimCLR 对比学习得到一个好的视觉预训练模型 link
SimCLR框架的理解和代码实现以及代码讲解 link
RepVGG 2021 link
github nightly torch_stable pytorch_lightning
opencv基础教程csdn
OpenCV中文官方文档 link
facechanging 变脸 github
AI美颜系列 CSDN
图像处理算法 博客园
图像的模糊检测方法 link
图像保边滤波算法集锦系列 github
只(挚)爱图像处理 link
Photoshop 算法原理 link
图像处理初学者设计的 100 个问题 github
YOLO
You Only Look Once: Unified, Real-Time Object Detection
中文版
中英文对照
YOLO9000
YOLO9000: Better, Faster, Stronger
中文版
中英文对照
Deformable-ConvNets
Deformable Convolutional Networks
中文版
中英文对照
Faster R-CNN
Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks
中文版
中英文对照
R-FCN
R-FCN: Object Detection via Region-based Fully Convolutional Networks
中文版
中英文对照
目标检测之Neck选择 link
详解目标检测中边界框的回归策略 link
目标检测中的特征冲突与不对齐问题 link
小目标检测学习汇总 link
在物体检测中搞定小目标 link
在目标检测中如何解决小目标的问题? link
目标检测中Anchor的本质分析 github
利用YOLOv3结合行人重识别模型,实现行人的检测识别,查找特定行人 github
CBNet:一种用于目标检测的复合骨干网络体系结构 2019 github
单级目标检测:YOLO与SSD,我选SSD!!! link
【SSD算法】史上最全代码解析-核心篇 github
MXNet的一个开源项目gluoncv里的yolov3代码,写了一份中文注解 github
faster-rcnn pytorch github
Why anchor link
Double-Head RCNN 通过增加多个head提升准确率github
对YOLOv3做模型剪枝 pytorch 2019 github
simpledet NAS-FPN 2019 mxnetgithub
PoolNet pytorch 2019 github
2018云从人头技术 冠军方案分享 github
目标检测进化史 link
ThunderNet: 轻量级实时检测网络
mmdetection github
Rapid satellite imagery object detection 2018 github
Yolo系列检测器的pytorch实现 github
awesome-object-detection github
deep_learning_object_detection github
RFCN_CoupleNet pytorch github
Yolo-v2 pytorch github
RFBNet pytorch github
CFENet pytorch github
BiSeNet pytorch github
kaggle 大白鲸目标检测 github
R-FCN+ResNet-50用自己的数据集训练模型 link
trident net + refinedet 目标检测 github
基于SSD框架在建筑工地上检测安全帽的佩戴并识别安全帽的相应颜色 link
基于 Mask R-CNN 的街景广告检测与模糊 tensorflow github
yolov3通道和图层修剪 github
YOLOv3+ASFF(自适应空间特征融合)组合,性能优于CornerNet和CenterNet等 github
使用通道修剪的Stronger-Yolo的Pytorch实现 github
Gaussian YOLOv3的PyTorch实现 github
PyTorch实现的EfficientDet(可扩展且高效的对象检测) github
Kaggle RSNA肺炎检测挑战赛中第一名解决方案的代码 github
天池大赛项目:天池新品实验室 - 淘宝直播商品识别 github
只用一页jupyter notebook完成Faster RCNN github
Pytorch版本中的Faster RCNN模型,已在ResGen 101的Visual Genome上进行了预训练 github
Faster-Rcnn:Two-Stage目标检测模型在Pytorch当中的实现 github
Scale-equalizing Pyramid Convolution for object detection github link
End-to-End Object Detection with Transformers 2020 github
yolov5 github
YOLOv3使用笔记——Kmeans聚类计算anchor boxes link
YOLO v4训练自己的数据集 link
深入浅出Yolo系列之Yolov3&Yolov4&Yolov5核心基础知识完整讲解 link
深入浅出Yolo系列之Yolov5核心基础知识完整讲解 link
You Only Look Twice: Rapid Multi-Scale Object Detection In Satellite Imagery 卫星图片多尺寸物体检测 link github
目标检测和感受野的总结和想法 link
目标检测算法anchor聚类实现(coco+voc)
小目标检测学习 link
BBAVectors:一种Anchor Free的旋转物体检测方法 link
Repulsion Loss 遮挡场景下的目标检测 link
mmdetection-mini github
1.8M超轻量目标检测模型NanoDet link
基于密度图的航空物体检测 link
Image-Level 弱监督图像语义分割汇总简析 link
CRNN
An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition
中文版
中英文对照
CTPN
Detecting Text in Natural Image with Connectionist Text Proposal Network
中文版
中英文对照
数学公式识别:基于编码-解码模型 link
MaskTextSpotter - 端到端可训练神经网络,用于发现任意形状文本的一个PyTorch实现 github
Text_Segmentation_Image_Inpainting 文件检测并修复 github
手写公式识别 :基于深度学习的端到端方法 github
基于MXNet的CTPN 身份证 github
深度学习实践文档检测 link
PyTorch实现的DenseBox多任务学习目标检测/关键点定位 github
增值税发票识别系统(OCR System of Invoice) link
文字相似度函数 pytorch github
深度学习与OCR论文合集 link
CCPD 车牌端对端识别及其250k的数据集 github
aster.pytorch github
Seq2Seq+Attention 中文OCR文字识别 pytorch github
A research project for text detection and recognition using PyTorch 1.2 github
AttentionOCR 2019 ocr检测和识别冠军 github
ABCNet - 利用自适应贝塞尔曲线网络实现的实时场景文本识别 github
运用unet实现对文档表格的自动检测,表格重建 github
条形图检测和坐标识别 github
超轻量级中文ocr,支持竖排文字识别, 支持ncnn推理 , psenet(8.5M) + crnn(6.3M) + anglenet(1.5M) 总模型仅17M github windows
通过Transformer实现的识别场景文本 github
pytorch_ctpn github
chinese_ocr CTPN + DenseNet + CTC github
一个基于CTPN+CRNN的OCR项目 github
更轻量的中文OCR github
汉字字符特征提取工具,可以提取出字符中的字音(声母、韵母、声调)、字形(偏旁、部首)、四角编码等特征,同时可作为tensor输入到模型 github
TextGenerator - OCR/文字检测/字体识别数据生成工具 github
《深度实践OCR:基于深度学习的文字识别》 随书代码 github
Table-OCR github
支持40+种语言和本地运行,这个OCR库轻松搞定光学字符识别 github
MaskTextSpotterV3端到端文本识别模型 github
手写及场景文字分析与识别的一些新尝试 link
PyTorch OCR模型的安卓端部署 link
基于Transformer文本识别模型的网络架构 link
车牌识别 模型部署翻车记:pytorch转onnx踩坑实录 link
古籍文档图像二值化:基于背景估计和能量最小化的方法 link
金山OCR识别框架KSAI-Toolkits [github](kingsoft-wps/KSAI-Toolkits (github.com))
Lightweight Image Super-Resolution with Information Multi-distillation Network (ACM MM 2019) github
图像超分:RealSR link
Open MMLab Image and Video Super-Resolution Toolbox, , including SRResNet, SRGAN, ESRGAN, EDVR, etc. MMSR:基于PyTorch的图像/视频超分辨率工具箱 github
FALSR 2019 小米 github
FixRes github
noise2noise-pytorch github
Pytorch实现多帧超分辨率(MFSR)网络HighRes-net github
去模糊GAN DeblurGANv2 github
High-Quality Self-Supervised Deep Image Denoising 2019 github
ABPN pytorch 2019 github
super-resolution github
超分辨率损失函数 link
使用具有批量重新归一化的深度CNN进行图像去噪 tensorflow 2019 github
Dandere2x github
Waifu2x-Extension-GUI github
generative_inpainting fillv2 github
srmd ncnn vulkan 通用图片超分放大工具 github
PyTorch实现“通过超高分辨率实现无损图像压缩” github
图像去模糊系列算法 link
MMSR 是基于PyTorch的开源图像和视频超分辨率工具箱,包括SRResNet,SRGAN,ESRGAN等 github
去雨网络(PReNet) github
2020年超越RCAN,图像超分又一峰 link
Software and pre-trained models for automatic photo quality enhancement using Deep Convolutional Networks github link
Deep Unfolding Network for Image Super-Resolution (CVPR, 2020) (PyTorch) github link
Generating RGB photos from RAW image files with PyNET (PyTorch) github
ZSSR link
2020超分辨算法CFSRCNN
如何恢复降采样后的高清图片?可逆图像缩放搞定 github
SRGAN
Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network
中文版
中英文对照
ESRGAN
ESRGAN: Enhanced Super-Resolution Generative Adversarial Networks
中文版
中英文对照
arcmargin loss
triplet loss
quadruplet loss
eml loss
npairs loss
度量学习中关于排序损失函数的综述 link
在应用中使用度量学习的最简单方法,具有模块化、灵活和可扩展,采用PyTorch编写 link
注:本资料集合包含机器学习、深度学习等各系列教程,深度学习方向主要计算机视觉资料为主,内容参考Github及网络资源,后续会补充,仅供个人学习,侵权联系删除!
文章浏览阅读1.8k次,点赞4次,收藏6次。python简易爬虫v1.0作者:William Ma (the_CoderWM)进阶python的首秀,大部分童鞋肯定是做个简单的爬虫吧,众所周知,爬虫需要各种各样的第三方库,例如scrapy, bs4, requests, urllib3等等。此处,我们先从最简单的爬虫开始。首先,我们需要安装两个第三方库:requests和bs4。在cmd中输入以下代码:pip install requestspip install bs4等安装成功后,就可以进入pycharm来写爬虫了。爬
文章浏览阅读2.6k次。解决方法:解决方法可以去github重新下载一个pyflakes.vim。执行如下命令git clone --recursive git://github.com/kevinw/pyflakes-vim.git然后进入git克降目录,./pyflakes-vim/ftplugin,通过如下命令将python目录下的所有文件复制到~/.vim/ftplugin目录下即可。cp -R ...._freetorn.vim
文章浏览阅读210次,点赞7次,收藏3次。本文简述了hello.c源程序的预处理、编译、汇编、链接和运行的主要过程,以及hello程序的进程管理、存储管理与I/O管理,通过hello.c这一程序周期的描述,对程序的编译、加载、运行有了初步的了解。_hit csapp
文章浏览阅读1w次,点赞2次,收藏27次。来源:机器人小妹 很多时候企业拥有重复,乏味且困难的工作流程,这些流程往往会减慢生产速度并增加运营成本。为了降低生产成本,企业别无选择,只能自动化某些功能以降低生产成本。 通过数字化..._人工智能平台
文章浏览阅读2.2k次。热加载能够在每次保存修改的代码后自动刷新 electron 应用界面,而不必每次去手动操作重新运行,这极大的提升了开发效率。安装 electron 热加载插件热加载虽然很方便,但是不是每个 electron 项目必须的,所以想要舒服的开发 electron 就只能给 electron 项目单独的安装热加载插件[electron-reloader]:// 在项目的根目录下安装 electron-reloader,国内建议使用 cnpm 代替 npmnpm install electron-relo._electron-reloader
文章浏览阅读942次。在11.0 进行定制化开发,会根据需要去掉recovery模式的一些选项 就是在device.cpp去掉一些选项就可以了。_android recovery 删除 部分菜单
文章浏览阅读2.2k次,点赞2次,收藏6次。继续上次的echart博客,由于省会流向图是从echart画廊中直接取来的。所以直接上代码<!DOCTYPE html><html><head> <meta charset="utf-8" /> <meta name="viewport" content="width=device-width,initial-scale=1,minimum-scale=1,maximum-scale=1,user-scalable=no" /&_java+echart地图+物流跟踪
文章浏览阅读1.4k次。一、OSD模块简介1.1 消息封装:在OSD上发送和接收信息。cluster_messenger -与其它OSDs和monitors沟通client_messenger -与客户端沟通1.2 消息调度:Dispatcher类,主要负责消息分类1.3 工作队列:1.3.1 OpWQ: 处理ops(从客户端)和sub ops(从其他的OSD)。运行在op_tp线程池。1...._ceph 发送数据到其他副本的源码
文章浏览阅读7.9k次,点赞3次,收藏22次。一 定义这是最早出现的置换算法。该算法总是淘汰最先进入内存的页面,即选择在内存中驻留时间最久的页面予以淘汰。该算法实现简单,只需把一个进程已调入内存的页面,按先后次序链接成一个队列,并设置一个指针,称为替换指针,使它总是指向最老的页面。但该算法与进程实际运行的规律不相适应,因为在进程中,有些页面经常被访问,比如,含有全局变量、常用函数、例程等的页面,FIFO 算法并不能保证这些页面不被淘汰。这里,我_进程调度fifo算法代码
文章浏览阅读133次。rownum是oracle才有的写法,rownum在oracle中可以用于取第一条数据,或者批量写数据时限定批量写的数量等mysql取第一条数据写法SELECT * FROM t order by id LIMIT 1;oracle取第一条数据写法SELECT * FROM t where rownum =1 order by id;ok,上面是mysql和oracle取第一条数据的写法对比,不过..._mysql 替换@rownum的写法
文章浏览阅读790次,点赞3次,收藏4次。官网下载下载链接:http://www.eclipse.org/downloads/点击Download下载完成后双击运行我选择第2个,看自己需要(我选择企业级应用,如果只是单纯学习java选第一个就行)进入下一步后选择jre和安装路径修改jvm/jre的时候也可以选择本地的(点后面的文件夹进去),但是我们没有11版本的,所以还是用他的吧选择接受安装中安装过程中如果有其他界面弹出就点accept就行..._ecjelm
文章浏览阅读245次。原文链接:https://linux.cn/article-7801-1.htmlifconfigping <IP地址>:发送ICMP echo消息到某个主机traceroute <IP地址>:用于跟踪IP包的路由路由:netstat -r: 打印路由表route add :添加静态路由路径routed:控制动态路由的BSD守护程序。运行RIP路由协议gat..._ifconfig 删除vlan