課程特色/目標>>
NVIDIA CUDA 實作坊: 運用 CUDA C/C++ 加速運算的基本原理
CUDA 是 NVIDIA 的平行運算架構,可運用 GPU 的強大處理能力,大幅增加運算效能。為能使學員輕鬆地瞭解 CUDA 的理念,本課程除了由淺入深地講述平行化加速計算概論外,同時將展示案例應用與優化處理方法與技巧,透過逐步引導使學員更能體會CUDA 之奧妙。
課程大綱>>
運用 CUDA C/C++加速運算的基本原理 NVIDIA® CUDA® 運算平台能夠讓 CPU-only 的運算應用程式在世界上最快的大規模平行 GPU 上加速運行。透過以下方式體驗 C /C ++ 應用加速:
1. 在 GPU 平台上釋放 CPU-only 的應用程式其潛在平行運算能力。
2. 運用基本的 CUDA 記憶體管理技術最佳化加速應用程式。
3. 使用 CUDA stream 展示加速應用程式的平行化潛力。
4. 利用命令行和視覺化分析來引導和檢查您的工作。
課程內容:
1. Accelerating Applications with CUDA C/C++
2. Managing Accelerated Application Memory with CUDA C/C++ Unified Memory and nvprof
3. Asynchronous Streaming, and Visual Profiling for Accelerated Applications with CUDA C/C++
講者簡介>>
李濬屹
國立清華大學資訊工程學系, 助理教授
對於智慧型機器人而言,從現實世界中收集訓練數據通常是非常耗時,甚至是危險的。因此機器人學習近期的研究方向,都主張使用模擬器作為訓練平台。然而,模擬器中的視覺數據與真實世界的視覺數據之間存在著差距。這個差距阻礙了在虛擬世界中訓練的模型成果,直接移轉到現實世界。本研究團隊提出了一個解決虛擬到現實問題的模組化架構。我們所提出的架構將學習模型分為感知模組和控制策略模組,並且使用語義圖像分割 (Image Semantic Segmentation) 作為這兩個模組傳遞的主要資訊。感知模組將感知到的 RGB 圖像進行語義圖像分割。控制策略模組則由目前最有效的深度強化學習方實作,訓練智慧型機器人能夠根據圖像分割轉換後的結果來執行動作。 本研究所提出的架構在閃避障礙物任務和目標跟隨任務中進行評估。實驗結果證明,本架構在虛擬環境和真實環境中明顯優於所有基準演算法,並且展現出比它們更快的學習曲線。我們還為各種相關配置提供詳細的分析,並驗證模塊化體系結構的可轉移性。本研究所提出的架構已於 NVIDIA Jetson TX2 開發板上實現, 並在真實機器人上進行全面評估,獲得良好的成果。
2019 年 1 月 9 日 (星期三)
逢甲大學Apple區域教育培訓中心 (圖書館 1F)
議程>>
時間 | Course Title | ||
---|---|---|---|
9:00-9:30 | Registration | 報到 | |
9:30-10:00 | NVIDIA GPU Graphic Card Archtiecture and Product Application Sharing - For Higher Education | NVIDIA GPU 專業繪圖顯卡架構應用分享 - 適用於教育界 | FRANK LIU 麗臺科技 技術經理 |
10:00-12:30 | Accelerating Applications with CUDA C/C++ | 運用 CUDA C/C++ 加速應用程式 | Chun_Yi Lee NVIDIA DLI 官方認證講師 |
12:30-13:30 | Lunch | 午休 | |
13:30-14:00 | NVIDIA GPU Application on Virtualization and Deep Learning Overview |
NVIDIA GPU 應用於虛擬桌面與深度學習技術概論 |
Resin Yan 零壹科技 技術工程師 |
14:00-15:30 | Managing Accelerated Application Memory with CUDA C/C++ Unified Memory and nvprof | 利用基本的 CUDA 内存管理技術来優化加速應用程序 | Chun_Yi Lee NVIDIA DLI 官方認證講師 |
15:30-15:45 | Tea Break | 中場休息 | |
15:45-16:45 | Asynchronous Streaming, and Visual Profiling for Accelerated Applications with CUDA C/C++ | 被加速的C/C++應用程序的非同步和可視覺化分析 | Chun_Yi Lee NVIDIA DLI 官方認證講師 |
16:45-17:00 | Wrap Up | 賦歸 |
活動場地路線圖>>
*僅開放在校學生與教職員參加