稀疏 - 智猿学院-IT界的百科全书

好的，各位观众，欢迎来到“稀疏矩阵奇妙之旅”讲座！今天咱们不聊八卦，只聊数据，而且是那种“稀疏”到骨子里，但又蕴藏着巨大能量的数据。什么是稀疏矩阵？别怕，没那么玄乎！想象一下，你手里有一张巨大的表格，记录了全国人民和他们喜欢的电影。如果每个人都看了所有电影，那这张表就满满当当，毫无空隙。但现实是，大部分人只会看一小部分电影，所以这张表上会布满大量的空白。这些空白，我们就可以认为是“0”。如果一张矩阵（也就是表格）里，大部分元素都是0，我们就说它是“稀疏矩阵”。反之，如果大部分元素都不是0，那就是“稠密矩阵”。为啥要用稀疏矩阵？难道0不是可以忽略的吗？理论上是这样，但实际上，当数据量大到一定程度，忽略0的代价就太大了！内存告急：稠密矩阵会老老实实地把每一个元素都存起来，不管它是0还是啥。如果你的矩阵大到几百万行几百万列，哪怕只有1%的非零元素，剩下的99%的0也会把你的内存榨干！计算龟速：很多矩阵运算，比如乘法，都需要遍历所有元素。如果大部分元素都是0，那我们就在做大量的无用功，浪费时间。所以，稀疏矩阵的出现，就是为了解决这两个问题：省内存，提速度！ SciPy 稀疏 …

继续阅读“SciPy 稀疏矩阵：处理大规模稀疏数据的内存与计算优化”