tag 标签: 图像识别

相关博文
  • 热度 1
    2025-2-20 09:43
    201 次阅读|
    0 个评论
    突破传统匿名化:先进技术解锁数据价值新维度
    海量数据 的收集使得新旧企业能够利用 机器学习 技术开发新产品并革新旧产品。近年来, 数据质量 因直接影响了人工智能系统的性能和鲁棒性而备受关注。然而,这对通常通过 破坏像素信息 (如模糊化、马赛克等)来实现匿名化的方法提出了挑战,这些方法导致合规性与数据质量之间难以兼得。 我们探索了一种不是简单移除像素信息,而是对其进行自然替换的 深度自然匿名化 (Deep Natural Anonymization,DNAT)方法,致力于提高匿名化数据价值,助力企业开发创新。 一、匿名化数据的传统矛盾 DNAT 能够检测人脸、车牌等可识别信息,并为每个对象生成 人工替换 。每个替换都尽可能匹配源对象的属性,但这种匹配是有选择性的,我们可以灵活控制保留哪些属性。 例如,对于人脸,保留性别和年龄等属性可能对后续分析至关重要。对于可识别信息以外的内容,不包含敏感个人数据的信息则保留不做修改。通过这种方式,DNAT成功打破了 数据消除与匿名化 之间的传统矛盾。 图1: 匿名化工具的比较,从左至右依次为:Facepixelizer,YouTube,Fast Redaction,DNAT,原图 为了衡量匿名化方法对数据质量的影响,我们从Labeled Face in the Wild(LFW)数据集中采样了图像。所有图像均取自测试集。我们 比较了 代表匿名化技术的 四种不同的匿名化工具 ,图1显示了这些示例的一部分。 二、匿名化的结构一致性 首先,我们分析了图像在匿名化处理后的 整体结构变化 。为此,我们仔细研究了图像分割结果。图像分割是将图像的像素划分为多个片段的过程,每个片段代表一个对象类别。在我们的示例中,最重要的对象是个人资料图片中的 人物和背景 。 图2和图3展示了LFW数据集中两位名人的分割图。这些分割图是由 语义分割模型DeepLabv3+ 生成的,采用了官方TensorFlow存储库中的实现和模型权重。 图2: AI Pacino DeepLabv3+ 分割结果对比 图3: Reese witherspoon DeepLabv3+ 分割结果对比 从图2和图3中可以看出,传统匿名化方法的分割图明显退化,其中一些甚至完全错误。然而, 深度自然匿名化(DNAT)保留了语义分割 。分割图与原始图像几乎完全相同。从图3中可以看出,经过传统匿名化方法处理的人脸图像不仅产生了较差的分割边界,还使分割模型推断出原始图像中 从未出现的新对象类别 ,如猫、狗或瓶子。 为了 量化每种匿名化技术的影响 ,我们计算了整个测试集的 平均交并比 (mIOU)。计算是在不同方法生成的图像分割图与原始图像分割图之间进行的。结果如表1所示。 表1:用mIOU测量的语义分割一致性(越高越好) 三、匿名化的内容一致性 为了评估匿名化图像与原始图像之间的 整体内容一致性 ,我们使用了 Clarifai的独立图像标注模型 。“通用图像标注模型能够识别超过11,000种不同的概念,包括对象、主题、情绪等。”这些标签描述了模型从输入图像中推断出的内容。 此外,模型还为每个标签提供了 置信度 。图4展示了Clarifai公共图像标注模型对原始图像及其DNAT版本预测的前5个概念。 图4:来自clarifai的Reese Witherspoon前5个概念。(左原始图像,右DNAT) 理想情况下,通用图像标注模型应该为原始图像和匿名化图像预测完全相同的概念。为了衡量一致性,我们使用Clarifai为每种匿名化技术的所有测试样本 预测概念 。然后,我们计算了匿名化图像与原始图像之间 前N个预测概念的平均精度 (mAP)(其中N代表不同概念的数量)。 通过mAP,我们评估了两点: 预测概念的一致性 及其 相关分数 。例如,考虑一个匿名化图像及其原始图像对,经过图像标注模型处理后,如果某个概念在匿名化图像中的置信度值低于其在原始图像中的置信度值,则对最终mAP分数的影响较小;而如果某个概念仅出现在匿名化图像中,而未出现在其原始图像中,则影响较大。 前5和前50个 概念的结果如表2所示。 表2:用mAP测量图像概念一致性(越高越好) 四、总结 本文探讨了如何通过 深度自然匿名化(DNAT) 技术提升 匿名化数据的价值 ,打破了传统匿名化方法在合规性与数据质量之间的固有权衡。DNAT通过生成自然替换而非破坏像素信息,不仅有效保护了个人隐私,还最大限度地保留了数据的分析价值。 实验表明,DNAT在 图像分割 和 内容一致性 方面显著优于传统匿名化方法,能够更好地支持后续的AI分析和应用。
  • 热度 4
    2023-12-17 08:47
    502 次阅读|
    0 个评论
    AI识别包括多种技术,其中图像识别和OCR识别是两种常见的技术。 图像识别是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对象的技术。图像识别是人工智能领域的一个重要分支,其应用范围非常广泛,包括安防、医疗、交通、金融、教育等多个领域。 OCR识别(Optical Character Recognition,光学字符识别)是指利用计算机对印刷或手写文本进行自动识别的技术。OCR识别技术可以将扫描或拍摄的文档、图片等转换成可编辑和检索的文本格式,从而方便地进行后续处理和应用。OCR识别技术在数字化图书馆、文档管理、数据录入等领域得到广泛应用。 需要注意的是,虽然图像识别和OCR识别都是利用计算机技术对图像进行自动处理和分析,但它们的应用场景和技术原理略有不同。图像识别更注重对图像中各种目标和对象的识别和分类,而OCR识别则更注重对文本字符的自动识别和转换。
  • 2023-9-8 17:20
    0 个评论
    Achronix与您相约“2023全球AI芯片峰会”
    2023 全球 AI 芯片峰会( GACS 2023 )将于 9 月 14-15 日在深圳市深圳湾万丽酒店举行。峰会由智一科技旗下芯东西联合智猩猩(智东西公开课全新品牌)联合发起主办,以「 AI 大时代 逐鹿芯世界」为主题。 届时, Achronix 将展出其最新的极高效能实时自动语音识别( Accelerated Automatic Speech Recognition, ASR )加速方案。该 ASR 解决方案具有低延迟、高性能、低开销的特点,它基于 BittWare® VectorPath® PCIe 加速器卡,其上搭载了 Achronix® 创新的高性能、高带宽 Speedster® 7t FPGA 芯片,以及 Myrtle.AI 提供的软件应用软件栈。专为高数据带宽优化的 Speedster7t FPGA 芯片可以支持各种人工智能 / 机器学习( AI/ML )应用,包括各种大语言模型( LLM )、图像 / 语音识别、高频交易、 ADAS 和自动驾驶等。作为一种带有外接主机 API 的完整解决方案,其应用不需要具备 RTL 或 FPGA 知识。 一块 VectorPath ™加速器卡 + 一台服务器 = 20 台 CPU 服务器或 10 个 GPU 加速器 Achronix 还将介绍针对高带宽、计算密集型和实时处理应用的最新的 FPGA 和 eFPGA IP 解决方案,包括 Speedster®7t 系列 FPGA 芯片、 Speedcore ™ eFPGA IP 和 VectorPath® 加速卡。 Speedster®7t 系列 FPGA 芯片: 支持二维片上网络( 2D network on chip )的高性能 FPGA 芯片,是具有 ASIC 级别性能的完全可编程 FPGA 。 Speedcore ™ eFPGA IP : 出货量已超 1500 万的 eFPGA IP 核,给 ASIC 和 SoC 带来高性能和逻辑可编程的灵活性。 VectorPath® 加速卡: 用于快速原型设计和快速生产的 PCIe 加速卡,支持 400G 和 200G 的以太网接口,支持高达 4 Tbps 的 GDDR6 存储。 预约会议与交流 联系我们预约安排会议或有针对性的演示。我们将很乐意与您共同研讨相关项目,以及 Achronix 如何帮助您实现目标性能和快速进入市场。 您可以发邮件到 Dawson.Guo@achronix.com ,预约与 Achronix 中国销售及技术支持团队的会议,并安排进一步交流。
  • 热度 9
    2023-2-10 18:11
    513 次阅读|
    0 个评论
    如果远程办公是您的未来,或者您经常通过视频通话与远方的朋友和亲戚交谈,那么您可以考虑购买网络摄像头以显著改善您的沟通。Anker PowerConf C200是个不错的选择。 Anker PowerConf C200专为个人工作空间而设计,能够以每秒30帧的速度拍摄2K视频。Anker提供可调节的视野(65°、78°或95°)、AI噪声消除和双立体声麦克风,可捕捉每个音节的细微差别。 深圳市雷龙发展有限公司 提供原厂技术支持,并提供君正集成电路完整解决方案,大大降低你的开发难度及开发时间 ​ Anker PowerConf C200安装了两个麦克风,通过降噪系统确保更好的语音采集,即使在嘈杂的环境中也能清晰地听到您的声音。 然后是自动白平衡系统,确保色彩始终忠实于现实,即使您在画面中移动,自动对焦也只需要半秒钟的时间来调整。 镜头拥有超大光圈f/2.0,即使房间光线条件较弱也能提供良好的画质,视角可在65°、78°和95°之间调节,可以根据实际需求扩大和缩小镜头(例如,如果只是工作聊天,镜头将聚焦在脸上;如果您正在与家人交谈并想展示孩子们在后面玩耍,则设置在95°)。 物理关闭镜头的机械开关对于保护隐私非常有用,尤其是在无需使用摄像头,或者视频通话过程中不得不突然遮盖住镜头时。 它通过USB-A 2.0插头连接到计算机,并兼容所有从Windows 7开始的计算机和从macOS 10.13开始的Mac。AnkerWork软件用于调整设置。 深圳市雷龙发展有限公司 提供原厂技术支持,并提供君正集成电路完整解决方案,大大降低你的开发难度及开发时间 文章来源:macitynet.it 关于北京君正 北京君正集成电路股份有限公司成立于2005年,基于创始团队创新的CPU设计技术,迅速在消费电子市场实现SoC芯片产业化,2011年5月公司在深圳创业板上市(300223)。 君正持续投入于多媒体编解码、影像信号处理、AI引擎、AI算法等核心领域并形成自有技术能力,其芯片在智能视频监控、AIoT、工业和消费、生物识别及教育电子领域获得了稳健和广阔的市场。 2020年,君正完成对北京矽成(ISSI)及其下属子品牌Lumissil的收购,并拥有其100%股份。ISSI于1988年成立于硅谷,主要为汽车、工业和医疗、通讯和企业设备、及消费等市场的电子产品提供、开发和设计具有高技术、高性能、高品质、高性价比的集成电路芯片,并已同全球用户建立了长期的供货关系。 其中,ISSI存储部门有高速低功耗SRAM,低中密度DRAM,NOR/NAND Flash,嵌入式Flash pFusion®,及eMMC等芯片产品。模拟和互联部门Lumissil有LED驱动、触控传感、音频驱动、微处理器、电源管理和互联等芯片产品。 深圳市雷龙发展有限公司 提供原厂技术支持,并提供君正集成电路完整解决方案,大大降低你的开发难度及开发时间
  • 热度 6
    2021-3-11 18:53
    78414 次阅读|
    3 个评论
    实战项目--图像识别--人民币识别
    实战项目旨在交流学习,项目相关资料请在关注 大鸟科创空间 微信公众号后回复项目关键字 ———“人民币识别” 以获取,欢迎在评论区交流意见。 简介:图像识别 --人民币识别 此方式简单的运用颜色空间来识别人民币,适合入门学习,准确度不高,仅能实现简单辨识。 先展示效果: 项目开发环境: Spyder(Python 3.7) 开发语言: Python demo功能: 1:对导入图片里面的人民币利用其色彩分布进行简单识别 2:图片中尽量不要有其他杂物 3:此方式准确度不高,适合入门学习 部分源码截图: 颜色空间适用于机器视觉的多个方面,在计算机上运行源码时候,需注意相关 opencv 库等环境已经安装完成。 至此项目介绍完毕,本项目旨在开源,想要获取源码资料的朋友,关注 大鸟科创空间 微信公众号后,回复项目关键字 ———“人民币识别” ,即可获得源码资料下载链接。 微信扫描下方二维码关注公众号“大鸟科创空间”
相关资源