异构 AI


  • 首页

  • 标签

  • 分类

  • 归档

  • 站点地图

  • 搜索

host overlap

发表于 2017-11-10 | 分类于 SDAccel , 优化 , host |
字数统计: 2,745

例程描述

这个示例将演示在一个应用中用户在主机端(CPU)与FPGA交叠的运算,从而达到将数据传输隐藏在计算过程中,提高数据传输效率。其中包括异步操作和事件对象。

主要学习知识点

  • Key Concepts
    • OpenCL API
    • Host 和 FPGA 同步 Synchronize Host and FPGA
    • 处理过程异步 Asynchronous Processing
    • 事件 Events
    • 异步拷贝 Asynchronous memcpy
    • Double Buffer 乒乓
    • Burst Transfer 突发传输
  • Keywords
    • cl_event
    • CL_QUEUE_OUT_OF_ORDER_EXEC_MODE_ENABLE
    • clEnqueueMigrateMemObjects
    • clEnqueueMapBuffer
阅读全文 »

MXNet model zoo 多网络推理

发表于 2017-11-09 | 分类于 Deep Learning , mxnet |
字数统计: 476

预备工作

  • 从MXNET model zoo 中下载对应的模型参数及json配置文件 链接
  • 下载 synset.txt 便于程序读取分类结果

源码实现

阅读全文 »

gmem_4bank

发表于 2017-11-09 | 分类于 SDAccel , 优化 , kernel_to_gmem |
字数统计: 2,637

例程描述

测试Kernel与Global Memory之间的带宽 multi bank(4块DDR独立数据传输)clEnqueueMapBuffer 与 clEnqueueUnmapMemobject 在 host 到 Global Memory 的数据优化

主要学习知识点

  • Key Concepts
    • Concurrent execution (并发执行)
    • Out of Order Command Queues (命令队列的执行顺序)
    • Multiple Command Queues (多个命令队列)
  • Keywords
    • cl_mem_ext_ptr_t
    • clEnqueueMapBuffer()
    • clEnqueueUnmapMemobject()
阅读全文 »

Hello World

发表于 2017-11-07 | 分类于 test |
字数统计: 203

Welcome to Hexo! This is your very first post. Check documentation for more info. If you get any problems when using Hexo, you can find the answer in troubleshooting or you can ask me on GitHub.

default default default

primary primary primary

success success success

info info info

danger danger danger

info

blah blah blah

blah blah blah

blah blah blah

应用技巧

自定义文字背景块

红色
紫色
棕色
粉红色
蓝色
绿色

Quick Start

Create a new post

$ index_z_group = (global_z - padd_offset)/VEC_SIZE $

1
$ hexo new "My New Post"

More info: Writing


阅读全文 »
1…56
王晓芸

王晓芸

54 日志
20 分类
35 标签
RSS
Links
  • AI 异构
© 2019 王晓芸
本站访客数 人次 本站总访问量 次
0%