探讨 Node.js 中的文件系统操作 (fs 模块) 如何进行异步读写、流式处理和权限控制。 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

嘿，大家好！我是你们今天的文件系统操作导游，准备好一起探索 Node.js 的 fs 模块了吗？今天我们要聊聊异步读写、流式处理和权限控制，保证你们听完之后，就能像操控乐高积木一样玩转文件系统。

一、异步读写：别阻塞你的小可爱线程！

Node.js 的一大特点就是它的非阻塞 I/O。想象一下，你正在煎牛排，如果每煎一面都要盯着，直到完全熟了才能翻面，那得多浪费时间啊！异步操作就像你同时煎好几块牛排，中间还可以去干点别的事情，比如刷刷手机或者准备酱汁。

fs 模块提供了两种读写文件的方式：同步和异步。同步操作会阻塞事件循环，就像盯着牛排一样，直到操作完成。异步操作则不会，它会把任务交给后台处理，完成后通过回调函数通知你。

1. 异步读取文件

const fs = require('fs');

fs.readFile('my_file.txt', 'utf8', (err, data) => {
  if (err) {
    console.error('读取文件出错:', err);
    return;
  }
  console.log('文件内容:', data);
});

console.log('这段代码会在读取文件之前执行！');

这段代码做了什么？

fs.readFile('my_file.txt', 'utf8', ...): 这就是异步读取文件的关键。第一个参数是文件名，第二个参数是编码方式（’utf8′ 是一种常见的编码方式），第三个参数是一个回调函数。
(err, data) => { ... }: 这个回调函数会在文件读取完成后执行。err 是错误对象，如果读取过程中出现错误，它就会包含错误信息。data 是文件内容。
console.log('这段代码会在读取文件之前执行！');: 重点来了！因为 readFile 是异步的，所以这行代码会在文件读取完成之前执行。这就是非阻塞的魅力！

2. 异步写入文件

const fs = require('fs');

const content = 'Hello, asynchronous world!';

fs.writeFile('my_new_file.txt', content, (err) => {
  if (err) {
    console.error('写入文件出错:', err);
    return;
  }
  console.log('文件写入成功！');
});

console.log('这段代码会在文件写入之前执行！');

和读取文件类似，writeFile 也是异步的。它接受文件名、要写入的内容和一个回调函数作为参数。

3. 异步追加写入文件

const fs = require('fs');

const content = 'This will be appended to the file.';

fs.appendFile('my_existing_file.txt', content, (err) => {
  if (err) {
    console.error('追加写入文件出错:', err);
    return;
  }
  console.log('文件追加写入成功！');
});

console.log('这段代码会在文件追加写入之前执行！');

appendFile 和 writeFile 的区别在于，appendFile 会在文件末尾追加内容，而 writeFile 会覆盖文件原有内容（如果文件存在）。

4. 使用 Promises 简化异步操作

回调函数有时候会让人头疼，尤其是当你需要进行多个异步操作的时候，回调地狱可不是闹着玩的。幸运的是，我们可以使用 Promises 来简化异步操作。

const fs = require('fs').promises; // 注意这里

async function readFileAndWrite() {
  try {
    const data = await fs.readFile('my_file.txt', 'utf8');
    console.log('文件内容:', data);
    await fs.writeFile('my_output_file.txt', data + 'nModified!');
    console.log('文件写入成功！');
  } catch (err) {
    console.error('操作出错:', err);
  }
}

readFileAndWrite();

console.log('这段代码会在读取文件之前执行！');

这里我们使用了 fs.promises，它提供了基于 Promise 的文件系统操作函数。async/await 让异步代码看起来像同步代码一样，大大提高了可读性。

二、流式处理：像流水线一样高效！

想象一下，你要搬运一卡车沙子。如果你一次性把所有沙子都扛起来，那肯定累个半死。但如果你用传送带，一点一点地把沙子运走，那就轻松多了。流式处理就像这个传送带，它允许你分块读取和写入数据，而不需要一次性把整个文件加载到内存中。

1. 创建可读流 (Readable Stream)

const fs = require('fs');

const readStream = fs.createReadStream('large_file.txt', { highWaterMark: 64 * 1024 }); // 64KB 缓冲区

readStream.on('data', (chunk) => {
  console.log('接收到数据块:', chunk.length);
  // 处理数据块
});

readStream.on('end', () => {
  console.log('文件读取完成！');
});

readStream.on('error', (err) => {
  console.error('读取文件出错:', err);
});

这段代码做了什么？

fs.createReadStream('large_file.txt', { highWaterMark: 64 * 1024 }): 创建一个可读流，从 large_file.txt 中读取数据。highWaterMark 选项指定了缓冲区的大小，这里设置为 64KB。这意味着每次读取最多 64KB 的数据。
readStream.on('data', (chunk) => { ... }): 监听 data 事件。当有数据块到达时，这个事件会被触发。chunk 就是接收到的数据块。
readStream.on('end', () => { ... }): 监听 end 事件。当文件读取完成时，这个事件会被触发。
readStream.on('error', (err) => { ... }): 监听 error 事件。如果在读取过程中出现错误，这个事件会被触发。

2. 创建可写流 (Writable Stream)

const fs = require('fs');

const writeStream = fs.createWriteStream('output.txt');

writeStream.write('First chunk of data.n');
writeStream.write('Second chunk of data.n');
writeStream.end('End of data.');

writeStream.on('finish', () => {
  console.log('文件写入完成！');
});

writeStream.on('error', (err) => {
  console.error('写入文件出错:', err);
});

fs.createWriteStream('output.txt'): 创建一个可写流，将数据写入 output.txt 文件。
writeStream.write(...): 向流中写入数据。
writeStream.end(...): 结束流，并写入最后的数据。
writeStream.on('finish', () => { ... }): 监听 finish 事件。当所有数据都写入文件后，这个事件会被触发。

3. 使用管道 (Pipe) 连接可读流和可写流

管道是流式处理的利器。它可以将一个可读流的输出直接连接到可写流的输入，而不需要手动监听 data 事件和调用 write 方法。

const fs = require('fs');

const readStream = fs.createReadStream('input.txt');
const writeStream = fs.createWriteStream('output.txt');

readStream.pipe(writeStream);

readStream.on('end', () => {
  console.log('文件复制完成！');
});

readStream.on('error', (err) => {
  console.error('读取文件出错:', err);
});

writeStream.on('error', (err) => {
  console.error('写入文件出错:', err);
});

readStream.pipe(writeStream) 这行代码就完成了整个复制过程。是不是很简单？

4. 流的类型

除了可读流和可写流之外，还有两种流：

Duplex Stream (双工流): 既可以读又可以写，例如 TCP socket。
Transform Stream (转换流): 在读写过程中可以修改数据，例如压缩流和加密流。

三、权限控制：保护你的数据！

文件系统权限控制是保护数据的重要手段。它可以限制哪些用户可以读取、写入或执行文件。

1. 文件权限基础

在 Linux 和 macOS 系统中，每个文件都有所有者 (owner)、所属组 (group) 和其他用户 (others) 三种身份。每种身份都有三种权限：

r (read): 读取文件的权限。
w (write): 写入文件的权限。
x (execute): 执行文件的权限。

这些权限可以用数字表示：

r: 4
w: 2
x: 1

例如，权限 rwxr-xr-- 表示：

所有者 (owner): 读、写、执行 (4 + 2 + 1 = 7)
所属组 (group): 读、执行 (4 + 1 = 5)
其他用户 (others): 只读 (4 = 4)

因此，rwxr-xr-- 可以用数字 754 表示。

2. 使用 fs.chmod 修改文件权限

const fs = require('fs');

fs.chmod('my_file.txt', 0o755, (err) => {
  if (err) {
    console.error('修改文件权限出错:', err);
    return;
  }
  console.log('文件权限修改成功！');
});

fs.chmod 函数用于修改文件权限。第一个参数是文件名，第二个参数是权限值，必须是八进制数（用 0o 开头）。

3. 使用 fs.chown 修改文件所有者和所属组

const fs = require('fs');

const uid = 1000; // 用户 ID
const gid = 1000; // 组 ID

fs.chown('my_file.txt', uid, gid, (err) => {
  if (err) {
    console.error('修改文件所有者出错:', err);
    return;
  }
  console.log('文件所有者修改成功！');
});

fs.chown 函数用于修改文件所有者和所属组。第一个参数是文件名，第二个参数是用户 ID，第三个参数是组 ID。

4. 使用 fs.stat 获取文件信息

const fs = require('fs');

fs.stat('my_file.txt', (err, stats) => {
  if (err) {
    console.error('获取文件信息出错:', err);
    return;
  }

  console.log('文件大小:', stats.size);
  console.log('创建时间:', stats.birthtime);
  console.log('修改时间:', stats.mtime);
  console.log('是否是文件:', stats.isFile());
  console.log('是否是目录:', stats.isDirectory());
  console.log('权限 (mode):', stats.mode.toString(8)); // 将 mode 转换为八进制字符串
  console.log('用户ID (uid):', stats.uid);
  console.log('组ID (gid):', stats.gid);
});

fs.stat 函数用于获取文件信息。stats 对象包含了文件的大小、创建时间、修改时间、权限等信息。

总结：一张表格胜千言！

功能	函数 (异步)	函数 (同步)	描述
读取文件	`fs.readFile`	`fs.readFileSync`	读取文件内容到内存。
写入文件	`fs.writeFile`	`fs.writeFileSync`	写入文件内容，覆盖原有内容。
追加写入文件	`fs.appendFile`	`fs.appendFileSync`	在文件末尾追加内容。
创建目录	`fs.mkdir`	`fs.mkdirSync`	创建目录。
删除目录	`fs.rmdir`	`fs.rmdirSync`	删除目录（必须为空）。
重命名文件/目录	`fs.rename`	`fs.renameSync`	重命名文件或目录。
删除文件	`fs.unlink`	`fs.unlinkSync`	删除文件。
读取目录	`fs.readdir`	`fs.readdirSync`	读取目录中的文件和子目录。
获取文件信息	`fs.stat`	`fs.statSync`	获取文件或目录的详细信息（大小、权限、创建时间等）。
修改文件权限	`fs.chmod`	`fs.chmodSync`	修改文件或目录的权限。
修改文件所有者	`fs.chown`	`fs.chownSync`	修改文件或目录的所有者和所属组。
创建可读流	`fs.createReadStream`	N/A	创建一个可读流，用于分块读取文件。
创建可写流	`fs.createWriteStream`	N/A	创建一个可写流，用于分块写入文件。
监听文件变化	`fs.watch`	N/A	监听文件或目录的变化。
复制文件	`fs.copyFile`	`fs.copyFileSync`	复制文件。

总结的总结：

Node.js 的 fs 模块功能强大，但使用时需要注意以下几点：

优先使用异步操作： 避免阻塞事件循环，提高性能。
合理使用流： 处理大文件时，流式处理可以显著降低内存占用。
注意错误处理： 每个异步操作都需要处理错误，避免程序崩溃。
了解文件系统权限： 保护你的数据安全。

好了，今天的讲座就到这里。希望你们通过今天的学习，能够更加自信地使用 Node.js 的 fs 模块进行文件系统操作。记住，实践是检验真理的唯一标准，多动手敲代码，才能真正掌握这些知识。祝大家编程愉快！

发表回复 取消回复

发表回复取消回复