计算机视觉-如何使用-有什么中文资料面包板社区

相关资源

[完结17章]计算机视觉—YOLO+Transfomer多场景目标检测实战

所需E币: 0

时间: 2025-5-20 14:11

大小: 3.64KB

上传者: huangyasir1990

一、目标检测技术演进与YOLO+Transformer的崛起目标检测作为计算机视觉领域的核心任务之一，经历了从传统方法到深度学习的革命性转变。在这一演进过程中，YOLO（YouOnlyLookOnce）系列算法以其独特的单阶段检测框架和出色的实时性能，成为工业界和学术界广泛采用的目标检测解决方案。从YOLOv1到最新的YOLOv8/9，该系列不断刷新着精度与速度的平衡点。与此同时，Transformer架构自2017年在自然语言处理领域大放异彩后，迅速席卷计算机视觉领域。VisionTransformer（ViT）的提出证明了纯Transformer结构在图像分类任务上的潜力，而随后的DETR则开创了Transformer在目标检测中的应用先河。YOLO与Transformer的结合代表了当前目标检测领域最富前景的技术路线之一。这种融合既保留了YOLO高效的特征提取和检测框架，又借助Transformer强大的全局建模能力，显著提升了模型对小目标、遮挡目标和复杂场景的检测能力。2021年以来，诸如YOLOS、YOLO-Transformer等混合架构不断涌现，在保持实时性的同时大幅提升了检测精度。二、YOLO与Transformer的互补优势分析 2.1YOLO架构的核心特点YOLO系列最显著的特点是"单阶段"检测策略，将目标检测视为统一的回归问题，直接预测边界框和类别概率。这种设计带来了几个关键优势：1. 极高的推理速度：避免了R-CNN系列的两阶段处理，单次前向传播即可完成检测2. 全局上下文感知：处理整幅图像而非局部区域，减少了背景误检3. 端到端可训练：简化了训练流程，便于优化然而，传统YOLO主要依赖CNN进行特征提取，其固有的局部感受野特性限制了模型对长距离依赖关系的建模能力。 2.2Transformer的视觉应用优势Transformer架构为计算机视觉带来了革命性的新特性：1. 全局注意力机制：通过自注意力层建立像素间的长距离依赖关系2. 动态权重分配：根据内容重要性自适应地聚焦关键区域3. 位置编码系统：明确建模空间位置关系，弥补了排列不变性的不足在目标检测任务中，这些特性特别有助于解决以下挑战：-复杂场景中的目标关系建模-小目标的精确检测-遮挡情况下的鲁棒识别 2.3融合架构的协同效应将YOLO与Transformer结合可以产生显著的协同效应：1. CNN+Transformer混合骨干网络：使用CNN提取低级视觉特征，Transformer建模高级语义关系2. 基于注意力的特征增强：在YOLO的特征金字塔中插入Transformer层，增强特征表达能力3. 动态感受野调整：通过注意力机制自适应调整不同目标的感受野大小这种混合架构通常能在保持YOLO实时性的前提下，将mAP提升3-5个百分点，特别是在小目标检测和密集场景中表现尤为突出。三、YOLO+Transformer架构关键技术解析 3.1主流融合架构设计当前YOLO与Transformer的融合主要有三种主流范式：1. Transformer作为特征增强模块：在YOLO的骨干网络或特征金字塔中插入Transformer层```python 简化的Transformer特征增强模块示例classTransformerBlock(nn.Module): def__init__(self,dim,heads=8): super().__init__() self.attention=nn.MultiheadAttention(dim,heads) self.norm=nn.LayerNorm(dim) defforward(self,x): B,C,H,W=x.shape x=x.flatten(2).permute(2,0,1) [HW,B,C] x=x+self.attention(x,x,x)[0] x=self.norm(x) returnx.permute(1,2,0).view(B,C,H,W)```2. 纯Transformer骨干网络：用VisionTransformer完全替代CNN骨干，如YOLOS3. 混合注意力机制：在YOLO的检测头中引入注意力，如YOLOv7-T 3.2位置编码的适应性改造由于目标检测对位置信息极度敏感，YOLO+Transformer架构需要特别设计位置编码系统：1. 相对位置编码：在注意力计算中加入相对位置偏置2. 多尺度位置编码：适应特征金字塔的不同分辨率3. 动态位置编码：根据内容生成位置权重 3.3计算效率优化策略保持实时性是YOLO系列的核心竞争力，融合Transformer时需要特别关注：1. 局部注意力窗口：将全局注意力限制在局部窗口内2. 稀疏注意力机制：只计算关键区域间的注意力3. 特征下采样策略：在深层网络降低特征图分辨率四、实战应用与性能调优指南 4.1模型选型建议根据不同的应用场景，推荐以下YOLO+Transformer变体：1. 边缘设备部署：YOLOv5-Tiny+MobileViT（轻量级）2. 通用目标检测：YOLOv8+SwinTransformer（平衡型）3. 高精度需求：YOLOX+DeiT（高性能） 4.2关键训练技巧1. 渐进式微调策略： -先冻结Transformer部分，训练CNN骨干 -然后联合微调整个网络 -最后小幅调整检测头2. 数据增强优化： -针对小目标增加Mosaic增强 -适当使用MixUp提升Transformer泛化性 -随机裁剪保留目标完整性3. 损失函数改进： -使用FocalLoss解决类别不平衡 -引入GIoU损失提升定位精度 -添加辅助损失监督中间特征 4.3部署优化方向1. 模型量化：将FP32转为INT8，减小模型体积2. 图优化：通过TensorRT等框架优化计算图3. 硬件适配：利用NPU加速Transformer计算五、未来展望与挑战YOLO与Transformer的融合仍处于快速发展阶段，未来可能呈现以下趋势：1. 完全注意力架构：如PureYOLO探索纯Transformer的YOLO实现2. 动态网络结构：根据输入图像复杂度自适应调整网络深度3. 多模态融合：结合文本、点云等多模态信息提升检测鲁棒性当前面临的主要挑战包括：-实时性与精度的平衡-小样本场景下的泛化能力-复杂背景下的误检控制随着神经架构搜索(NAS)和自动化机器学习(AutoML)技术的发展，未来可能出现更高效的YOLO+Transformer混合架构，进一步推动目标检测技术在自动驾驶、工业质检、医疗影像等领域的应用边界。结语YOLO与Transformer的融合代表了目标检测技术发展的最前沿，这种结合既保留了YOLO系列高效实时的优势，又通过Transformer的全局建模能力显著提升了检测精度。随着研究的深入和工程优化的持续进行，这类混合架构有望成为工业级目标检测的新标准。对于实践者而言，理解这两种范式的互补特性，掌握其融合的关键技术，将有助于开发出更强大、更适应实际需求的视觉检测系统。
[17章]计算机视觉—YOLO+Transfomer多场景目标检测实战

所需E币: 0

时间: 2025-4-22 09:34

大小: 3.12KB

上传者: huangyasir1990

1.引言目标检测是计算机视觉领域的核心任务之一，广泛应用于自动驾驶、安防监控、工业质检、医疗影像分析等领域。近年来，基于深度学习的目标检测算法取得了显著进展，其中 YOLO（YouOnlyLookOnce）系列和 Transformer 架构分别代表了卷积神经网络（CNN）和自注意力机制在目标检测中的成功应用。然而，CNN擅长局部特征提取，而Transformer擅长建模全局依赖关系，二者的结合（如 YOLO+Transformer ）成为研究热点。本文将从YOLO和Transformer的原理出发，分析二者的融合方式，并探讨如何在实际多场景目标检测任务中应用这些技术。 2.YOLO目标检测：速度与精度的平衡 2.1YOLO的核心思想 YOLO由JosephRedmon等人于2016年提出，其核心思想是将目标检测视为单阶段的回归问题，直接在输入图像上预测边界框和类别概率，从而实现极高的检测速度。 YOLO的主要优势包括：- 实时性：单次前向传播即可完成检测，适合高帧率场景（如视频监控）。- 端到端训练：无需复杂的区域提议（如FasterR-CNN的两阶段检测）。- 轻量化设计：YOLOv3、YOLOv4、YOLOv5等版本不断优化计算效率。 2.2YOLO的演进 - YOLOv1-v3 ：基于DarkNet，逐步改进多尺度预测和特征融合。- YOLOv4 ：引入CSPDarkNet、PANet、Mish激活函数等，提升精度。- YOLOv5 （非官方）：采用PyTorch实现，优化训练流程和部署便利性。- YOLOv6/v7/v8 ：进一步优化Backbone、Neck和Head结构，支持更复杂任务。尽管YOLO在速度上占优，但在小目标检测和长距离依赖建模方面仍存在局限，而Transformer的引入可以弥补这些不足。 3.Transformer在目标检测中的应用 3.1Transformer的基本原理 Transformer最初由Vaswani等人提出（2017），用于自然语言处理（NLP），其核心是自注意力机制（Self-Attention），能够捕捉输入序列的全局关系。在视觉任务中，Transformer的典型应用包括：- ViT（VisionTransformer）：将图像分块输入Transformer进行特征提取。- DETR（DetectionTransformer）：首个基于Transformer的端到端目标检测模型，使用匈牙利匹配算法进行预测。 3.2Transformer的优势 - 全局建模能力：克服CNN的局部感受野限制，适合大目标或复杂场景。- 并行计算：自注意力机制可并行处理所有像素，提升计算效率。- 灵活的结构设计：可结合CNN或纯Transformer架构。然而，Transformer的计算复杂度较高，且在小数据集上容易过拟合，因此与YOLO的结合成为优化方向。 4.YOLO+Transformer：融合架构解析 4.1为什么需要融合？ - YOLO的不足：对小目标检测效果较差，缺乏全局上下文建模。- Transformer的不足：计算成本高，训练数据需求大。二者的结合可以：✅提升小目标检测能力 ✅增强模型对复杂场景的适应性 ✅保持较高的推理速度 4.2主流融合方法（1）Backbone替换将YOLO的CNNBackbone（如DarkNet）替换为Transformer结构，例如：- YOLOS ：基于ViT的YOLO变体，直接使用Transformer提取特征。- YOLOv5+SwinTransformer ：采用SwinTransformer的层次化设计，降低计算量。（2）Neck增强在YOLO的Neck（特征融合模块）中引入Transformer，例如：- YOLOv5+CBAM（卷积注意力模块）：在PANet中增加注意力机制。- YOLOv7+TransformerEncoder ：在特征金字塔中插入Transformer层，增强多尺度特征融合。（3）Head优化在检测头（Head）中使用Transformer进行预测，例如：- DETR-styleHead ：用Transformer解码器替代YOLO的Anchor-Based预测。 4.3典型模型：YOLO+Transformer实战案例以 YOLOv5+SwinTransformer 为例，其改进点包括：1. Backbone ：SwinTransformer替代CSPDarkNet，提升全局特征提取能力。2. Neck ：保留PANet，但增加跨窗口注意力机制。3. Head ：沿用YOLOv5的检测头，但优化损失函数。实验表明，该模型在COCO数据集上mAP提升约3-5%，同时保持较高推理速度。 5.多场景目标检测实战 5.1自动驾驶场景 - 挑战：车辆、行人、交通标志等多尺度目标检测。- 解决方案：YOLOv6+DeformableDETR，增强对小目标的敏感性。 5.2工业质检 - 挑战：缺陷检测（如划痕、裂纹）需要高精度。- 解决方案：YOLOv8+LocalAttentionTransformer，聚焦局部细节。 5.3无人机航拍 - 挑战：大尺度变化、背景复杂。- 解决方案：YOLOv7+SwinTransformer，优化多尺度特征融合。 5.4医疗影像 - 挑战：细胞、器官等微小结构检测。- 解决方案：YOLO-Med（基于YOLOv5+TransformerNeck），提升医学图像分析能力。 6.未来展望 1. 轻量化设计：探索更高效的Transformer变体（如MobileViT）与YOLO结合。 2. 自监督学习：利用无标注数据预训练，提升小数据场景下的泛化能力。 3. 3D目标检测：扩展至点云数据，用于自动驾驶和机器人导航。 7.结论 YOLO与Transformer的结合代表了目标检测领域的最新趋势，既能保持YOLO的高效性，又能利用Transformer的全局建模优势。未来，随着硬件加速（如NPU、GPU优化）和算法改进， YOLO+Transformer 将在更多实际场景中发挥关键作用。对于开发者而言，选择合适的融合策略（如Backbone替换、Neck增强或Head优化）并针对具体任务调整模型，是提升检测性能的关键。
4.2 OpenCV 开源跨平台计算机视觉库.pdf

所需E币: 1

时间: 2023-9-26 09:59

大小: 476.83KB

上传者: 一蓑烟雨as

4.2OpenCV开源跨平台计算机视觉库.pdf
ONNXRUNTIME计算机视觉模型部署与加速教程

所需E币: 0

时间: 2023-7-26 15:48

大小: 1011B

上传者: 蝴蝶结欧恩

分享课程——ONNXRUNTIME计算机视觉模型部署与加速教程，附源码。课程全面介绍了ONNXRUNTIME版本的C++SDK的使用技巧，一步一步演示教学ONNXRUNTIME框架上如何部署主流图像分类、对象检测、实例分割、语义分割模型、姿态评估与关键点检测模型。使用Python脚本与工具行命令轻松实现TorchVision中各种模型导出与简化ONNX格式模型，工程化封装代码，实现推理代码复用，三行代码即可实现接口调用，支持CPU与GPU加速等各种开发实战技巧，全面提升深度学习模型部署与加速能力。ONNXRuntime：由微软推出，用于优化和加速机器学习推理和训练，适用于ONNX模型，是一个跨平台推理和训练机器学习加速器。ONNX（OpenNeuralNetworkExchange）是一种标准与开放的网络模型交换格式，直白点说就是tensorflow/pytorch/paddle等深度学习框架训练的模型都可以转换为ONNX格式，然后ONNX格式模型可以通过ONNXruntime组件实现模型的推理预测并加速，从而实现不基于原来框架的模型部署。
OpenVINO2022计算机视觉模型部署与加速视频教程

所需E币: 0

时间: 2023-6-29 13:00

大小: 1.67KB

上传者: 学习菜鸟小弟弟

分享OpenVINO2022安装部署视频教程——《OpenVINO2022计算机视觉模型部署与加速教程》，附带源码+模型文件+思维导图下载！自推出以来OpenVINO一直紧随AI的技术发展，保持着高频的迭代更新，来解决各行各业开发者提出的各种需求和面临的挑战。这次版本迭代，从2021.4到2022.1，改动很大，可以说是迄今为止最重大的更新。最新版本精简了安装包和运行时库，添加了Auto-DevicePlugin、MO参数简化等一系列的有利于开发者快速上手的功能，也官宣了对PaddlePaddle的正式支持，其他还有推理API的改进等等，有兴趣可以查看官网文档，这里不一一而论。配置OpenVINO2022开发环境主要是针对C++部分，使用VS2017配置。这部分跟以前没有太大差异，同样需要配置包含目录，库目录与附加依赖项添加，跟环境变量，这几个部分的配置分别如下：若你同我一样默认安装路径直接复制即可(无需任何改动，复制进去直接回车即可)包含目录C:\ProgramFiles(x86)\Intel\openvino_2022\runtime\include;C:\ProgramFiles(x86)\Intel\openvino_2022\runtime\include\ie;C:\ProgramFiles(x86)\Intel\openvino_2022\runtime\include\ngraph;C:\ProgramFiles(x86)\Intel\openvino_2022\runtime\include\openvino应用要想强大，性能表现很重要。2021.2版本的OpenVINO，针对使用TensorflowQuantization-Aware（对权重进行逐通道量化）方式训练的模型，模型优化器新增了相应的逐通道量化支持，以高效的模型压缩，降低延时，提高性能。强大的应用，安全当然也是重中之重。2021.2版本提供了全新的安全插件，使用安全打包和执行，控制模型的访问权限。该插件基于KVM虚拟机和Docker容器，部署起来快速方便。此外，对于RedHatEnterpriseLinux(RHEL)8.2的支持，让OpenVINO的应用场景更加广泛。
TensorRT8.6 计算机视觉模型部署与加速教程

所需E币: 0

时间: 2023-6-30 11:10

大小: 1.51KB

上传者: 开心就很好了

TensorRT8.6计算机视觉模型部署与加速教程分享，2023新课，视频+代码+数据下载！1、什么的TensorRTTensorRT是nvidia家的一款高性能深度学习推理SDK。此SDK包含深度学习推理优化器和运行环境，可为深度学习推理应用提供低延迟和高吞吐量。在推理过程中，基于TensorRT的应用程序比仅仅使用CPU作为平台的应用程序要快40倍。2、cuda、cudnn和tensorrt的关系CUDA是NVIDIA推出的用于自家GPU的并行计算框架，也就是说CUDA只能在NVIDIA的GPU上运行，而且只有当要解决的计算问题是可以大量并行计算的时候才能发挥CUDA的作用。CUDA的主要作用是连接GPU和应用程序，方便用户通过CUDA的API调度GPU进行计算。cuDNN（CUDADeepNeuralNetworklibrary）：是NVIDIA打造的针对深度神经网络的加速库，是一个用于深层神经网络的GPU加速库。它能将模型训练的计算优化之后，再通过CUDA调用GPU进行运算.当然你也可直接使用CUDA，而不通过cuDNN，但运算效率会低好多。因为你的模型训练计算没有优化。TensorRT是英伟达针对自家平台做的加速包，只负责模型的推理（inference）过程，一般不用TensorRT来训练模型的，而是用于部署时加速模型运行速度。3、TensorRT部署TensorRT只需要知道网络的结构和参数即可，它支持三种转换入口：TF-TRT，要求是TensorFlow模型ONNX模型格式使用TensorRTAPI手动把模型搭起来，然后把参数加载进去找到TensorRT的下载地址，我这边选择的是TensorRT8,TensorRT支持以下几种方式安装，分别是deb,tar,rpm。我这边的系统是Ubuntu22.04，CUDA版本是11.6，选择的安装方式是tar进行安装。关于tar的安装方式，可以参考Nvidia官方文档中关于tar的部分。NVIDIADeepLearningTensorRTDocumentation关于tar的安装方式，可以参考Nvidia官方文档中关于tar的部分。所以整个逻辑就是：把你的模型导出成ONNX格式。把ONNX格式模型输入给TensorRT，并指定优化参数。使用TensorRT优化得到TensorRTEngine。使用TensorRTEngine进行inference。
OpenVINO2022计算机视觉模型部署与加速教程

所需E币: 0

时间: 2023-6-29 11:57

大小: 1.55KB

上传者: 开心就很好了

《OpenVINO2022计算机视觉模型部署与加速教程》分享，视频+源码+模型文件+思维导图下载！1.1OpenVINOTMTM安装环境OpenVINOTMTM是一款依赖计算机或智能设备硬件的模型推理部署套件，在边缘启用基于CNN的深度学习推理，支持跨英特尔®CPU、英特尔®集成显卡、英特尔®神经计算棒2和英特尔®视觉加速器设计与英特尔®MovidiusTMVPU的异构执行。此处我们介绍在Windows平台上的安装和使用。由于OpenVINOTMTM是一款依赖计算机或智能设备硬件的模型推理部署套件，因此它可以在自家的设备上很好的运行，经过测试，在Windows平台上，非intelCPU设备也可以运行OpenVINOTMTM，例如AMD推出的CPU，此处安装使用的设备为AMDR7-5800H；对于显卡设备不支持英伟达等其他显卡，仅支持英特尔自家显卡。友情提醒在导出ONNX格式模型后，可以使用Netron可视化网络结构，明确网络的输入、输出名称以及尺寸，为推理作准备！导出时可以指定input&outputname，尤其是多输出模型，这样在推理后可以推理请求中根据name获取结果；实际上，OpenVINO2022支持自动获取输入、输出节点名称！！单输入、单输出的模型可以放心交给API，而多输出模型也可以像旧版本一样通过name获取，也可以通过输出编号获取结果。2022版本加载模型提供了两种模式分别是read_model与compile_model方式，这两种方式得到分别是model跟compiledmodel，其中通过read_model方式读取的model对象可以通过compile_model函数转换为compiledmodel，同时它们都支持直接访问属性获取输入与输出层信息（inputs/outputs）然后重启VS2019，执行如下代码测试：#include<openvino/openvino.hpp>#include<opencv2/opencv.hpp>usingnamespacecv;usingnamespacestd;intmain(intargc,char**argv){ //创建IE插件,查询支持硬件设备 ov::Coreie; vector<string>availableDevices=ie.get_available_devices(); for(inti=0;i<availableDevices.size();i++){ printf("supporteddevicename:%s\n",availableDevices[i].c_str()); } return0;}
计算机视觉简介.pdf

所需E币: 0

时间: 2023-6-28 13:51

大小: 2.92MB

上传者: 张红川

计算机视觉简介.pdf
OpenVINO2022计算机视觉模型部署与加速课程

所需E币: 0

时间: 2023-6-27 15:46

大小: 665B

上传者: 蝴蝶结欧恩

分享课程——OpenVINO2022计算机视觉模型部署与加速课程，附源码+模型文件+思维导图。课程目录：章节1课程概述章节2部署ResNet图像分类模型章节3车辆检测与中文车牌识别章节4行人检测人脸检测表情识别与关键点检测章节5语义与实例分割模型部署与加速推理章节6OCR应用-场景文字检测与识别章节7自定义模型部署与转换章节8YOLOv5部署与加速章节9Python版本SDK介绍与推理演示章节10课程总结源码+模型文件+思维导图
TensorRT8.6 计算机视觉模型部署与加速课程

所需E币: 0

时间: 2023-6-1 16:00

大小: 729B

上传者: 蝴蝶结欧恩

分享课程——TensorRT8.6计算机视觉模型部署与加速课程，2023新课，提供代码+数据。课程全面介绍了TensorRT8.6版本的C++SDK的使用技巧，一步一步演示教学TensorRT8.x版本上如何部署主流图像分类、对象检测、实例分割、语义分割模型。使用TensorRT提供的工具与SDK接口实现从FP32到FP16与INT8模型量化加速，自己开发提供了量化脚本支持YOLOv5~YOLOv8系列模型一键量化INT8，使用OpenCVCUDA函数实现预处理加速等各种开发实战技巧，全面提升深度学习模型部署与加速能力。
2D计算机视觉：原理、算法及应用-(计算机视觉丛书)-章毓晋

所需E币: 1

时间: 2023-6-1 11:53

大小: 15.72MB

上传者: 无量头颅无量血

2D计算机视觉：原理、算法及应用-(计算机视觉丛书)-章毓晋
计算机视觉：一种现代方法

所需E币: 1

时间: 2023-4-12 09:27

大小: 14.75MB

上传者: 无量头颅无量血

计算机视觉：一种现代方法
人工智能：计算机视觉，一站式体系化全面进阶课

所需E币: 0

时间: 2023-4-12 17:25

大小: 602B

上传者: 蝴蝶结欧恩

分享课程——人工智能：计算机视觉，一站式体系化全面进阶课，升级版32周，包含图像分割+目标检测+人脸识别+模型分析+图像生成GAN等内容。对标大厂人工智能岗位要求，多重维度构建能力模型理论与实践紧密结合，每个技术栈均搭配工业级项目操练配套案例极为丰富，举一反三，覆盖深度学习核心应用场景
深度学习之PyTorch实战计算机视觉-唐进民

所需E币: 2

时间: 2023-4-11 10:10

大小: 109.42MB

上传者: 无量头颅无量血

深度学习之PyTorch实战计算机视觉-唐进民
人工智能：计算机视觉，一站式体系化全面进阶（升级版32周）

所需E币: 0

时间: 2023-4-10 16:35

大小: 1.4KB

上传者: 学习菜鸟小弟弟

分享一套人工智能体系课程——《人工智能：计算机视觉，一站式体系化全面进阶》，课程一共32周，提供配套的源码和数据（94G的数据）下载！人工智能：计算机视觉体系化进阶，10大专业方向，10种细分技能，一次搞定！从框架到模型，从理论到实战，循序渐进系统进阶，几十个配套案例，覆盖深度学习核心应用场景！5大课程亮点，贯彻“工业范”教学理念，更专注于技能和项目系统性一套完备的人工智能知识体系，从理论过渡到实践，岗位核心技能一网打尽专业性课程全面使用工业级真实项目作为案例，充分复现真实工作场景，学以致用权威性讲师具有工业界资深背景，有丰富的实践经验，带领团队完成多个复杂专业项目丰富性课程提供参考论文文档、项目数据和代码等资料，直播、社区多种形式助学理论与实践紧密结合，每个技术栈均搭配工业级项目操练数据使用数据获取数据整理数据标注数据增强图像分类多类别图像分类细粒度图像分类多标签图像分类半监管与无监管图像分类零样本图像分类图像分割图像分割基础语义分割弱监管语义分割ImageMatting实例分割目标检测Two-stage算法-FasterRCNN系列讲解One-stage算法-YOLO系列讲解Anchor-free算法系列讲解模型设计模型设计思想网络宽度、深度与模型性能注意力机制轻量级模型模型可视化分析可视化分析复杂度分析时间分析模型速度分析图像生成GAN全卷积图像生成GAN条件生成GAN多尺度图像生成GAN风格化GAN数据仿真与增强GAN人脸图像检测与识别人脸检测关键点检测人脸识别人脸属性识别模型优化模型优化基础模型剪枝模型量化模型蒸馏视频分类视频分类基础3DCNN模型双流模型时序模型
计算机视觉-夏皮罗-计算机科学丛书

所需E币: 3

时间: 2023-3-29 17:07

大小: 172.08MB

上传者: 无量头颅无量血

计算机视觉-夏皮罗-计算机科学丛书
计算机视觉 - 计算理论与算法基础-张正友

所需E币: 1

时间: 2023-3-29 17:08

大小: 13.61MB

上传者: 无量头颅无量血

计算机视觉-计算理论与算法基础-张正友
计算机视觉 - 模型、学习和推理-Simon J. D. Prince

所需E币: 1

时间: 2023-3-28 10:50

大小: 97.49MB

上传者: 无量头颅无量血

计算机视觉-模型、学习和推理-SimonJ.D.Prince-计算机科学丛书-机械工业出版社
基于计算机视觉的移动机器人路径识别系统

所需E币: 5

时间: 2023-2-14 09:51

大小: 276.07KB

上传者: czd886

基于计算机视觉的移动机器人路径识别系统
基于计算机视觉的室内自主移动机器人导航综述

所需E币: 5

时间: 2023-2-14 12:37

大小: 1.4MB

上传者: czd886

基于计算机视觉的室内自主移动机器人导航综述

更多...

标签: 计算机视觉