erasure - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

2025年7月15日

C++ `Type-erasure` 模式：使用 `std::function` 实现的类型无关回调

哈喽，各位好！今天咱们来聊聊C++里一个相当酷的概念——类型擦除（Type Erasure），以及如何用std::function来实现它。这东西听起来玄乎，但其实用处大得很，能让你的代码更灵活、更通用。什么是类型擦除？想象一下，你是个魔法师，想要施一个咒语，让一个东西“隐形”。类型擦除就有点像这样，只不过我们隐形的是类型信息。具体来说，类型擦除是一种技巧，用于隐藏具体的类型，同时仍然允许调用该类型的方法。换句话说，你可以创建一个可以接受不同类型对象，但表现得好像它们具有相同类型的接口。为什么要类型擦除？解耦合：类型擦除可以降低代码的耦合度。调用者不需要知道被调用者的具体类型，只需要知道它符合某个接口。通用性：你可以编写更通用的代码，可以处理多种类型，而无需为每种类型编写单独的函数或类。简化接口：在某些情况下，类型擦除可以简化接口，隐藏不必要的类型细节。 std::function：类型擦除的利器 std::function 是 C++ 标准库提供的一个模板类，它可以存储任何可调用对象（函数指针、lambda 表达式、函数对象），只要这些可调用对象的签名与 std: …

继续阅读“C++ `Type-erasure` 模式：使用 `std::function` 实现的类型无关回调”

2025年5月31日

Hadoop 3.x 新特性：Erasure Coding 与 YARN Federation

Hadoop 3.x 新特性：Erasure Coding 与 YARN Federation，一场数据大冒险！ 🚀 各位观众，各位老铁，大家好！我是你们的老朋友，人称“Bug终结者”的程序员老王。今天，我们要聊聊Hadoop 3.x 的两个重磅炸弹级新特性：Erasure Coding 和 YARN Federation。这两个家伙，一个能帮你省钱省到飞起，另一个能让你的集群规模无限扩展，简直是数据大冒险中的神器！想象一下，你是一个勇敢的探险家，面对着浩瀚的数据海洋，你的目标是找到宝藏（有价值的信息），但同时，你也要提防海盗（数据丢失）和资源匮乏。Hadoop 3.x 的这两个新特性，就像是你的超级潜艇和无限燃料，让你在数据海洋中畅游无阻！废话不多说，让我们开始今天的探险之旅吧！第一站：Erasure Coding，省钱才是硬道理！💰 话说，Hadoop HDFS 一直以来都使用三副本机制来保证数据的可靠性。这就像是给你的数据买了三重保险，安全是安全了，但是成本也是杠杠的！你想啊，一份数据存三份，存储空间直接膨胀三倍，这谁顶得住啊？ 😭 好比你买了三个一模一样的房子，里面放着同 …

继续阅读“Hadoop 3.x 新特性：Erasure Coding 与 YARN Federation”

2025年5月31日

大数据存储层优化：HDFS Erasure Coding 与 S3 Select 的实践

好的，各位观众老爷们，大家好！我是你们的老朋友，人称“代码诗人”的程序猿小李，今天咱们来聊聊大数据存储层的优化，这可是个既烧脑又有趣的话题。想象一下，你是一位坐拥亿万数据的土豪，如何安全又省钱地把这些宝贝疙瘩存好，可不是件容易事。今天，我们就来聊聊两位“管家”——HDFS Erasure Coding和S3 Select，看看他们是如何为你的数据保驾护航，还能帮你省下一大笔开销！💰 第一幕：数据存储的“痛点”与“痒点” 在进入正题之前，咱们先来聊聊数据存储的那些“痛点”和“痒点”。痛点一：空间浪费！传统的HDFS默认采用三副本机制，这意味着你存一份数据，实际上要占用三份存储空间！这就像你买了一件衣服，结果买了三件一模一样的，钱多也不能这么糟蹋啊！ 💸 痛点二：读取性能！虽然三副本提高了数据可靠性，但在读取小文件时，会增加NameNode的压力，影响整体性能。就像你开着一辆豪华跑车，却只能在拥堵的市区龟速行驶，憋屈啊！ 🚗💨 痒点一：成本控制！作为一名精打细算的土豪，我们当然希望在保证数据安全的前提下，尽可能地降低存储成本。毕竟，谁的钱也不是大风刮来的！ 🌬️ 痒点二：高效查询 …

继续阅读“大数据存储层优化：HDFS Erasure Coding 与 S3 Select 的实践”