使用Zynq US+FPGA进行深度学习

深度学习算法在边缘物联网应用中正变得越来越流行,因为它在目标识别和分类方面具有人类水平的准确性。一些用例包括但不限于安全摄像头中的人脸检测和识别、视频分类、语音识别、实时多目标跟踪、字符识别、手势识别、财务预测和医疗诊断系统。作为机器学习的一个子集,深度学习算法受到人脑神经网络的启发。在机器学习中部署生物神经网络概念在解决以前不可能解决的学习问题方面显示出了强大的有效性。特别是,卷积神经网络(CNN)在计算机视觉应用中显示了灵活可靠的图像检测和识别。这些网络的深层创建了一个用于创建深度学习模型的神经网络。

听起来,在物联网边缘设备中实现这些算法需要支持低功耗、计算量大的多层网络的处理系统。CPU无法达到预期的性能,因为它们需要密集的CPU操作和内存带宽。在这方面,需要使用FPGA、ASIC和GPU作为边缘处理核心。FPGA由于具有可重新配置能力、并行性和能效,在计算密集型图像和语音识别应用中具有更好的性能。我们在一个单独的主题中分析了机器学习应用的GPU与FPGA的更多细节这里.

使用FPGA开发深度学习申请可能听起来很困难。在Aldec,我们通过为客户提供了即用的FPGA的物体检测解决方案来铺平了这条路径,以便我们的客户快速启动他们的项目。在这些应用中,深度学习处理单元(DPU)在FPGA侧实现以进行加速,从而导致35 FPS输入3个通道输入。事实上,FPGA的更大,我们可以添加的DPU单位越多,带来更好的性能。TySOM-3A-ZU19EG嵌入式原型板具有1,143k逻辑单元,允许实现多个(1-3)个DPU,这对于许多频道处理应用程序至关重要。下图显示了演示的结构和输出屏幕上的结果。

TySOM-3A-ZU19EG嵌入式原型板

用户可以使用实时摄像机或预录视频作为此参考设计的输入。为了连接外部摄像头,Aldec提供FMC-ADAS.带有HSD连接器的5倍FPD-LINK的卡。它可以用作aldec的延伸ADAS应用程序它有几个摄像头输入。预先录制的视频可以使用micro SD卡、SATA或从云端提供给主板。

除了对象检测应用外,ALDEC还提供用于面部检测,手势检测,行人检测和分割的SDX平台。这些演示设计作为参考设计提供给我们的Zynq的原型设计板客户。使用不同的输入测试这些设计,例如USB相机,FMC-ADA卡,使用FPD III链路和存储在SD卡上的预先录制视频连接到蓝鹰相机。有关性能分析,请参阅下表。


应用名称

输入 表演
tysom-3a. Tysom-3
FMC-ADAS. 最多30 fps 最多30 fps

手势检测

视频 最高每秒18帧 最多17个fps
FMC-ADAS. 最多30 fps 最多30 fps

行人检测

视频 高达25 FPS 高达25 FPS
FMC-ADAS. 最多30 fps 最多30 fps

分段

视频 最多24个fps 最多24个fps
FMC-ADAS. 高达10 FPS 高达10 FPS

交通检测

视频 最高每秒36帧 高达35 fps
FMC-ADAS. 最多30 fps 最多30 fps

表1.基于DNN的Tysom-3a和Tysom-3的设计性能分析

主要特征

  • 包括TySOM-3A-ZU19EG或者TySOM-3-ZU7EV
  • 包括参考设计和如何创建DNN设计的说明
  • 基于ADAS的解决方案包括FMC-ADAS卡和192度宽镜头的蓝鹰相机
  • 每个视频通道上的性能最高可达40 fps
  • 预构建并可随时使用的文件预加载到SD卡中

溶液含量

问我们一个问题
十、
问我们一个问题
十、
验证码图像 重新加载验证码
输入的数据不正确。
非常感谢。您的问题已提交。请留出1-3个工作日,以便有人回答您的问题。
发生内部错误。你的问题没有提交。请联系我们使用反馈表.
我们使用cookie确保我们为您提供最佳的用户体验,并为您提供我们认为与您有关的内容。如果您继续使用我们的网站,您同意我们使用cookie。关于使用cookie和其他网站信息的详细概述位于我们的隐私政策.
Baidu