pytorch - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

2025年8月18日

Python高级技术之：`Python`的`PyTorch`和`TensorFlow`：从底层看`Python`如何调用`CUDA`。

各位老铁，今天咱们来聊聊Python玩转深度学习的两大神器：PyTorch和TensorFlow。更刺激的是，我们要扒开它们的外衣，看看Python到底是怎么指挥GPU上的CUDA干活的！准备好了吗？坐稳扶好了，发车了！开场白：Python，深度学习的幕后大佬 Python这玩意儿，语法简单，库又多，简直是深度学习领域的“万金油”。但你有没有想过，Python本身并不擅长大规模的数值计算，更别提直接操作GPU了。那PyTorch和TensorFlow是怎么让Python“遥控”GPU的呢？答案就在于它们底层对CUDA的封装。第一部分：CUDA：GPU的“母语” 首先，咱们得了解一下CUDA。简单来说，CUDA就是NVIDIA为自家GPU开发的一套并行计算平台和编程模型。你可以把CUDA想象成GPU的“母语”，只有用CUDA，你才能充分发挥GPU的并行计算能力。 CUDA包含以下几个关键概念： Kernel（内核函数）：这是在GPU上执行的并行代码，通常是计算密集型的任务。 Device（设备）：指的就是GPU。 Host（主机）：指的是CPU。 Memory（内存）： CUD …

继续阅读“Python高级技术之：`Python`的`PyTorch`和`TensorFlow`：从底层看`Python`如何调用`CUDA`。”

2025年7月9日

PyTorch/TensorFlow 自定义层与模块：构建独特神经网络结构

PyTorch/TensorFlow 自定义层与模块：构建独特神经网络结构大家好！欢迎来到今天的“神经网络DIY：自定义层与模块大作战”讲座！今天我们不聊那些高深的数学公式，只谈怎么用PyTorch和TensorFlow这两把瑞士军刀，打造属于你自己的神经网络零件。想象一下，你是一位乐高大师，但是你发现市面上卖的乐高积木不够用了，你想要更奇特的形状，更独特的功能，怎么办？那就自己造！自定义层和模块就是神经网络界的乐高积木，让你摆脱框架的束缚，创造出独一无二的神经网络结构。为什么要自定义层和模块？你可能会问：“现成的层和模块已经够多了，我为什么要费劲自己写？” 问得好！原因很简单：满足特殊需求：有些任务需要特定的计算方式，现有的层可能无法完美满足。比如，你需要一个能记住历史信息的层，或者一个能处理图数据的层，现成的可能不够灵活。实验创新想法：神经网络的研究日新月异，也许你想尝试一种全新的激活函数，或者一种全新的连接方式，自定义层能让你快速验证你的想法。性能优化：针对特定硬件或任务，你可以自定义层来优化计算过程，提高效率。代码复用与模块化：将常用的功能封装成模块，方 …

继续阅读“PyTorch/TensorFlow 自定义层与模块：构建独特神经网络结构”

2025年7月9日

PyTorch/TensorFlow 自定义 `autograd`：实现复杂梯度的自动求导

好，各位老铁，今天咱们来聊聊PyTorch和TensorFlow里自定义 autograd 这事儿，说白了就是教机器咋算一些复杂的梯度。这东西听起来玄乎，其实就是让咱们能更灵活地控制模型训练，搞一些奇奇怪怪的骚操作。开场白：为啥要自定义 autograd？话说回来，PyTorch和TensorFlow自带的自动求导已经够用了，为啥还要自己动手呢？原因嘛，很简单，就是内置的梯度计算搞不定的时候。比如：梯度不可导: 某些操作在数学上根本就不可导，比如ReLU在0点。虽然框架会默认处理，但有时候你想搞点更精细的控制。效率问题: 某些自定义操作，如果用框架自带的算子拼凑，计算梯度可能效率很低。自己实现一遍，说不定能快上几倍。研究需要: 搞学术的，总想搞点新花样，自定义 autograd 是必须的。想装逼: 承认吧，有时候就是想秀一下自己的编程技巧。总之，自定义 autograd 就是为了更大的自由度和控制力。 PyTorch自定义 autograd：从零开始 PyTorch里自定义 autograd，主要涉及两个部分：定义一个继承自 torch.autograd.Functio …

继续阅读“PyTorch/TensorFlow 自定义 `autograd`：实现复杂梯度的自动求导”

2025年7月8日

PyTorch/TensorFlow 自定义层与模块：构建独特神经网络结构

好的，咱们今天就来聊聊PyTorch和TensorFlow里那些“定制款”的神经网络零部件——自定义层和模块。别害怕，虽然听起来高大上，但其实就像搭乐高一样，只要掌握了基本原理，就能拼出属于你自己的“变形金刚”。开场白：为啥要“定制”？话说回来，PyTorch和TensorFlow自带的那些层和模块，已经够我们用一阵子了。比如卷积层、全连接层、RNN、LSTM等等，都是神经网络界的“常青树”。那为啥还要费劲巴拉地自己写呢？原因很简单：需求不一样啊！有时候，你遇到的问题比较特殊，现成的模块没法直接套用。比如，你需要一个具有特定约束的激活函数，或者一个特殊的损失函数，那就得自己动手丰衣足食了。性能优化！框架提供的模块，虽然通用性强，但有时候为了适应各种情况，牺牲了一些性能。如果你能针对特定硬件或者算法进行优化，就能获得更好的效果。研究需要！为了探索新的神经网络结构或者算法，你可能需要自己实现一些新的层或者模块，验证你的想法。总之，自定义层和模块，就像是程序员的“瑞士军刀”，能让你更灵活地解决问题。 PyTorch：一切皆对象在PyTorch里，构建自定义层和 …

继续阅读“PyTorch/TensorFlow 自定义层与模块：构建独特神经网络结构”

2025年7月8日

PyTorch/TensorFlow 自定义 `autograd`：实现复杂梯度的自动求导

好的，各位观众，欢迎来到“PyTorch/TensorFlow 自定义 autograd：实现复杂梯度的自动求导”讲座现场！今天咱们就来聊聊深度学习框架里一个非常酷炫的功能——自定义 autograd。这玩意儿就像是给框架装了个 turbo 引擎，让它能处理更复杂、更个性化的梯度计算。第一部分：什么是 Autograd？为啥我们需要自定义它？首先，咱们得搞清楚 autograd 是个啥。简单来说，autograd 就是“自动求导”的意思。它负责追踪你的张量（Tensor）运算，然后自动帮你计算梯度。这就像你辛辛苦苦写了一个复杂的数学公式，然后有个小精灵自动帮你算出每个变量的导数，简直不要太爽！ PyTorch 和 TensorFlow 都内置了强大的 autograd 引擎，能够处理大部分常见的操作。但是！人生总有意外，总有一些场景是内置的 autograd 搞不定的。比如：非标准操作：你自己发明了一个新的激活函数，或者一个新的损失函数，框架里没有现成的梯度计算公式。性能优化：某些操作的梯度计算非常耗时，你想用更高效的算法来加速它。特定需求：你需要在梯度计算过程中加入一 …

继续阅读“PyTorch/TensorFlow 自定义 `autograd`：实现复杂梯度的自动求导”

2025年7月7日

C++ LibTorch (PyTorch C++ API)：深度学习模型推理与训练

各位观众老爷们，大家好！欢迎来到今天的“LibTorch深度历险记”讲座。今天咱们不讲虚的，直接上干货，用C++ LibTorch来玩转深度学习，让你的代码像开了挂一样，嗖嗖的！开篇：为啥要用LibTorch？Python它不香吗？ Python确实香，简单易上手，生态丰富。但有些时候，Python的性能就有点捉襟见肘了。比如，你需要在嵌入式设备上跑模型，或者对延迟有极致要求，又或者你想把深度学习集成到一个大型的C++项目中。这时候，LibTorch就派上用场了。 LibTorch，简单来说，就是PyTorch的C++ API。它让你能在C++环境中直接加载、推理和训练PyTorch模型，性能杠杠的！第一章：环境搭建，万事开头难？No！工欲善其事，必先利其器。咱们先来搭建LibTorch的开发环境。下载LibTorch: 打开PyTorch官网 (pytorch.org)，找到LibTorch那一栏，根据你的操作系统和CUDA版本，下载对应版本的LibTorch包。解压: 把下载的包解压到你喜欢的地方，比如 ~/libtorch。配置CMake: 接下来，我们需要用CMak …

继续阅读“C++ LibTorch (PyTorch C++ API)：深度学习模型推理与训练”

2025年6月13日

深度学习框架底层：PyTorch, TensorFlow 中的 NumPy 角色

好的，各位观众，各位朋友，欢迎来到今天的“深度学习框架底层大揭秘”特别节目！我是你们的老朋友，人称“代码界的段子手”的编程专家，今天就来跟大家聊聊PyTorch和TensorFlow这两位深度学习界的扛把子，以及在它们背后默默奉献的NumPy老大哥。咱们今天要聊的，可不是那种教科书式的讲解，什么“NumPy是Python的扩展包，提供了多维数组对象…” 😴 别睡啊！我们要用更生动有趣的方式，把这些硬核知识给啃下来！开场白：深度学习界的“铁三角” 想象一下，深度学习就像一座金字塔，而PyTorch和TensorFlow就是金字塔上最耀眼的两颗明珠。它们负责统筹全局，指挥算法，让AI能够像模像样地识别猫猫狗狗，翻译各种语言，甚至还能写诗作曲！简直是无所不能！但是！各位可别忘了，金字塔的基石才是最重要的！而NumPy，就是支撑起这座金字塔最坚实的那一块基石！它就像一位默默无闻的老黄牛，任劳任怨，为PyTorch和TensorFlow提供最基础，也是最重要的数据结构——多维数组（也就是我们常说的Tensor）。所以，我们可以把PyTorch、TensorFlow和NumPy看作深度学习 …

继续阅读“深度学习框架底层：PyTorch, TensorFlow 中的 NumPy 角色”

2025年6月9日

PyTorch 深度学习：动态图与灵活性的优势

PyTorch 深度学习：动态图与灵活性的优势 – 深度学习界的“变形金刚” 🤖 大家好！欢迎来到今天的 PyTorch 深度学习讲座。今天我们要聊的是 PyTorch 的一个核心特性，也是它区别于其他框架，例如 TensorFlow（早期的静态图模式）的一个重要标志：动态图机制。想象一下，你在厨房里做菜。静态图框架就像给你一份严格的菜谱，所有步骤，所有配料的量，必须事先规划好，一步也不能错。一旦开始做，就不能随意更改，比如想临时加点辣椒🌶️，或者多放点盐🧂，那是不允许的！而 PyTorch 的动态图呢？它就像一个经验丰富的厨师，可以根据实际情况，随时调整菜谱，灵活应变。如果尝了一下觉得淡了，可以立刻加盐；觉得不够辣，可以马上放辣椒。这种灵活性，在深度学习领域，简直就是神器！今天，我们就来深入探讨一下 PyTorch 动态图的魔力，看看它到底是如何让深度学习变得更酷、更灵活、更有趣的！ 1. 静态图 vs 动态图：一场“先知”与“即时”的较量 ⚔️ 在深入动态图之前，我们先简单了解一下静态图。静态图（Static Graph）：预定义，后执行：就像编译型语言，需 …

继续阅读“PyTorch 深度学习：动态图与灵活性的优势”