2017年9月21日 8:00 至 2017年9月24日 18:00 ,中国科学院计算技术研究所烟台分所 烟台中科网络技术研究所在 烟台举办《GPU高性能计算程序设计与深度学习应用高级实操班》,会议大约有40人参加。
会议内容
主办方介绍
GPU高性能计算程序设计与深度学习应用高级实操班宣传图
随着信息技术飞速发展,需要处理的海量数据越来越巨大,高性能计算能力就显得尤为重要。近两年GPU(CUDA、OPENACC、OPENCL)计算在人工智能/深度学习、生物信息、金融、物理模拟等领域飞速发展,展现出相比传统CPU计算巨大的优势。GPU高性能计算程序设计最大限度的利用硬件资源,极大的提高了计算能力,降低时间成本,加速研发进度。特别是随着人工智能/深度学习技术的崛起,GPU计算已经成为深度学习计算的首选解决方案。为了培养GPU高性能计算以及深度学习技术人才,中国科学院计算技术研究所烟台分所特别邀请高性能计算及深度学习领域的专家,举办“GPU高性能计算程序设计与深度学习应用高级实操班“。
主办单位: 中国科学院计算技术研究所烟台分所
承办单位: 北京中科云畅应用技术研究院
时间地点: 2017年 9月21日 — 2017年9月 24日 烟 台
(第一天报到,培训三天)
目标:
1、提高GPU高性能计算程序设计与开发水平;
2、学习深度学习常用算法;
3、学习并实践深度学习GPU计算解决方案;
4、提供符合自身特点的工程计算解决方案。
对象:
从事高性能计算、人工智能/深度学习、物联网、虚拟现实、生物信息、有限元、理论物理、分子模拟、计算化学、材料力学、系统仿真、流体力学、机械设计、动力设计、生物制药、航空动力、地质勘探、气候模拟、船舶设计等领域的企业单位、科研院所的计算技术开发人员,及高等院校相关专业教学人员及在校研究生、硕士、博士等相关人员。
方式:
1、培训讲座;
2、高性能计算环境下的上机实操
3、专题小组研讨与案例讲解分析结合;
中国科学院计算技术研究所烟台分所 烟台中科网络技术研究所
计算所烟台分所是面向网络应用技术的研究机构,在地方挂“烟台中科网络技术研究所(烟台网络所)”牌子,是烟台市政府批准设立的事业单位。 烟台网络所与中科院计算所网络数据科学与工程研究中心共同承担了天玑系列大规模网络数据处理系统的研发工作,并作为天玑网络数据系统的研发和产业化基地。 定位为将国家战略需求和地方产业需求紧密结合的新型研究所,明确“一个方向”——以海量网络信息处理为主要发展方向,建设海量网络数据计算平台、大规模网络仿真平台、互联网深度信息服务平台这“三大平台”。
中国科学院计算技术研究所(烟台分所)
中科院计算技术研究所烟台分所(烟台分所)是中国科学院计算技术研究所与烟台高新技术产业开发区共同组建的网络应用技术研究机构,定位为将国家战略需求和地方产业需求紧密结合的新型研究所。是中科院计算所第一个将技术整体转移并实现资源共享、信息互通的地方分支机构。明确“一个方向”:以海量互联网数据的深度信息处理为主要发展方向。建设“三大平台”:海量网络数据计算平台,大规模网络仿真平台,互联网深度信息服务。产出“三类价值”:学术、系统和应用、产业孵化。
GPU高性能计算程序设计与解决方案实操班 课程大纲
一、 GPU高性能计算——并行计算基础 1、并行计算的应用场景和实际意义(战略、经济和成本);2、并行计算机体系结构:处理器、内存和互连网,常用的并行计算机系统;3、性能分析模型:如何测量并行性能和扩展性;4、 CPU/GPU体系结构对比介绍:流水线、多核、缓存、访存、通信模型、分支预测等;5、 常用的高性能开发技术概述:5.1 OpenMP编程;5.2 Pthreads编程;5.3 MPI编程;
上机实验:1、 求解π值
二、GPU高性能计算——OpenACC编程基础与优化进阶 1、 OpenACC基础:概念,与CUDA区别,编译器,生态;2、 OpenACC开发环境搭建配置;3、 OpenACC四步开发流程:判断并行性,并行化表达,显式数据传递,优化 3.1判断并行性:Profile工具pgprof;3.2并行化表达:引导关键字Kernerls和Parallel Loop;3.3显式管理数据的拷贝:引导关键字Data;3.4优化:统一内存管理,线程并行层级,collapse,tile
OpenACC上机实操:1. Hellow world; 2.矢量点乘;
三、 GPU高性能计算——CUDA编程基础与优化进阶 1、 CUDA基础:API、数据并行、线程模型、存储模型、控制、同步、并发和通信、加速比;2、 CUDA开发环境搭建和工具配置;3、 CUDA优化进阶:线程组织调度,分支语句,访存优化,数据传输,原子操作;4、 GPU并行计算模式及案例分析: 分析调试:parallel nsight,visual profiler,cuda-gdb;5、 CUDA生态系统和相关专业领域软件介绍;
CUDA上机实操:1. Helloworld,向量加,cuda库的使用(cuBLAS、cuFFT );2. 矩阵乘,直方图,卷积,规约,前缀求和 ;
四、 大规模并行开发:多GPU开发 1、 GPU异步编程,多GPU编程(混合OpenMP和MPI)及调试调优工具;2、 OpenACC互操作性:OpenMP,MPI,CUDA;
OpenACC上机实操:1、 Jacobi迭代,分形图
五、 GPU高性能计算——OpenCL编程基础 1、 OpenCL:编程模型,存储模型,生态;CUDA vs OpenCL;
OpenCL上机实操:1、点乘;
六、 GPU高性能计算——深度学习 1、 深度学习基础介绍:神经网络,BP 方法,回归,统计学习,Hessian矩阵,基础数学等2、 常见的网络模型和平台框架:3、 深度学习GPU解决方案:3.1基于GPU的交互式深度学习训练平台:DIGITS;3.2深度学习框架的GPU加速:TensorFlow,Caffe等;3.3 NVIDIA深度学习SDK:cuDNN,TensorRT,NCCL;3.4深度学习显卡选择;
深度学习上机实操:1、 使用DIGITS进行目标识别检测,信号处理;2、 Caffe,TensorFlow,Theano等通用深度学习框架的GPU加速库cuDNN的使用;3、 深度学习前端推理引擎TensorRT的使用;4、 单机多卡的深度学习解决方案NCCL实验;
七、GPU计算最新技术前沿 1、CUDA 9新特性介绍;2、Pascal/Volta显卡架构介绍;
即将更新,敬请期待
会议门票
费用:每人 3900元(含报名费、培训费、资料费),食宿可统一安排,费用自理。