MySQL的`FEDERATED`存储引擎：如何实现跨数据库的查询？ - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

MySQL `FEDERATED` 存储引擎：跨数据库查询的艺术

大家好，今天我们来深入探讨 MySQL 的 FEDERATED 存储引擎，并学习如何利用它实现跨数据库的查询。 FEDERATED 引擎允许我们在本地 MySQL 服务器上创建一个表，该表的数据实际上存储在远程 MySQL 服务器上的另一个表中。这为我们提供了一种透明的方式访问和查询远程数据，而无需复制数据到本地。

1. `FEDERATED` 引擎简介

FEDERATED 引擎本身并不存储数据。相反，它充当一个指向远程 MySQL 表的指针。当你查询 FEDERATED 表时，查询会被转发到远程服务器，远程服务器执行查询并将结果返回给本地服务器。本地服务器再将结果返回给客户端。

1.1 优点

无需数据复制： 避免了大量数据复制和同步的开销，节省了存储空间和网络带宽。
实时数据访问： 可以直接访问远程数据库中的实时数据，保持数据的一致性。
简化数据集成： 提供了一种简单的方式将来自不同 MySQL 服务器的数据集成到一起。
降低本地服务器负载： 远程服务器负责实际的数据存储和查询处理，降低了本地服务器的负载。

1.2 缺点

依赖网络连接： 需要稳定的网络连接才能访问远程数据。网络延迟和中断会影响查询性能。
安全风险： 需要配置远程服务器的访问权限，存在一定的安全风险。
性能瓶颈： 所有查询都必须经过网络传输，可能会成为性能瓶颈，尤其是在处理大量数据时。
事务支持有限： FEDERATED 引擎对事务的支持比较有限，不支持跨服务器的分布式事务。
配置复杂性： 需要正确配置本地和远程服务器的连接参数，可能涉及一些复杂的配置步骤。

2. 配置 `FEDERATED` 引擎

要使用 FEDERATED 引擎，首先需要确保它在你的 MySQL 服务器上已经启用。

2.1 检查 `FEDERATED` 引擎是否启用

可以使用以下 SQL 语句检查 FEDERATED 引擎是否启用：

SHOW ENGINES;

如果输出结果中 FEDERATED 引擎的 Support 列显示为 YES 或 DEFAULT，则表示该引擎已启用。

2.2 启用 `FEDERATED` 引擎

如果 FEDERATED 引擎未启用，可以通过修改 MySQL 配置文件 (my.cnf 或 my.ini) 来启用它。

在配置文件中添加以下行：

federated

然后重启 MySQL 服务器。

2.3 创建用户并授权访问远程数据库

在远程 MySQL 服务器上，需要创建一个用户并授予其访问特定数据库和表的权限。

-- 在远程服务器上执行
CREATE USER 'federated_user'@'%' IDENTIFIED BY 'password';
GRANT SELECT ON remote_db.* TO 'federated_user'@'%';
FLUSH PRIVILEGES;

federated_user: 用于 FEDERATED 连接的用户名。
'%': 允许来自任何 IP 地址的连接。出于安全考虑，建议限制为特定的 IP 地址或 IP 地址范围。
password: 用户的密码。请使用强密码。
remote_db.*: 授予对 remote_db 数据库中所有表的 SELECT 权限。可以根据需要限制为特定的表。

3. 创建 `FEDERATED` 表

在本地 MySQL 服务器上，需要创建一个 FEDERATED 表，该表指向远程 MySQL 表。

CREATE TABLE `local_table` (
  `id` INT(11) NOT NULL AUTO_INCREMENT,
  `name` VARCHAR(255) DEFAULT NULL,
  `age` INT(11) DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=FEDERATED
CONNECTION='mysql://federated_user:password@remote_host:3306/remote_db/remote_table';

local_table: 本地 FEDERATED 表的名称。
ENGINE=FEDERATED: 指定使用 FEDERATED 存储引擎。
CONNECTION: 连接字符串，用于指定远程 MySQL 服务器的连接信息。
- mysql://: 连接协议。
- federated_user:password: 远程 MySQL 服务器的用户名和密码。
- remote_host: 远程 MySQL 服务器的 IP 地址或域名。
- 3306: 远程 MySQL 服务器的端口号。
- remote_db: 远程数据库的名称。
- remote_table: 远程表的名称。

注意: 本地 FEDERATED 表的结构应该与远程表的结构保持一致。虽然不强制完全一致，但最好保持列名和数据类型匹配，以避免数据类型转换错误和查询问题。如果远程表有自增主键，本地表也需要定义相同的主键，但不需要设置为自增。

4. 查询 `FEDERATED` 表

创建 FEDERATED 表后，就可以像查询普通表一样查询它。

SELECT * FROM local_table;

这条 SQL 语句会将查询转发到远程 MySQL 服务器，远程服务器执行查询并将结果返回给本地服务器。本地服务器再将结果返回给客户端。

5. 示例

假设我们有两台 MySQL 服务器：

本地服务器： IP 地址为 192.168.1.100，数据库名称为 local_db。
远程服务器： IP 地址为 192.168.1.200，数据库名称为 remote_db，表名称为 users。

远程服务器上的 users 表结构如下：

-- 在远程服务器上执行
CREATE TABLE `users` (
  `id` INT(11) NOT NULL AUTO_INCREMENT,
  `name` VARCHAR(255) DEFAULT NULL,
  `email` VARCHAR(255) DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

现在我们想在本地服务器上创建一个 FEDERATED 表，指向远程服务器上的 users 表。

首先，在远程服务器上创建一个用户并授予权限：

-- 在远程服务器上执行
CREATE USER 'federated_user'@'192.168.1.100' IDENTIFIED BY 'password';
GRANT SELECT ON remote_db.users TO 'federated_user'@'192.168.1.100';
FLUSH PRIVILEGES;

然后，在本地服务器上创建 FEDERATED 表：

-- 在本地服务器上执行
CREATE TABLE `local_users` (
  `id` INT(11) NOT NULL,
  `name` VARCHAR(255) DEFAULT NULL,
  `email` VARCHAR(255) DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=FEDERATED
CONNECTION='mysql://federated_user:[email protected]:3306/remote_db/users';

现在，我们可以像查询普通表一样查询 local_users 表：

-- 在本地服务器上执行
SELECT * FROM local_users WHERE name LIKE '%John%';

这条 SQL 语句会将查询转发到远程服务器，远程服务器执行查询并将结果返回给本地服务器。

6. `FEDERATED` 引擎的使用注意事项

索引： FEDERATED 引擎不会将远程表的索引信息同步到本地。因此，查询性能可能会受到影响。建议在远程表上创建适当的索引，以提高查询性能。
数据类型： 确保本地 FEDERATED 表的列数据类型与远程表的列数据类型兼容。否则，可能会导致数据类型转换错误和查询问题。
权限管理： 仔细管理远程服务器的访问权限，确保只有授权的用户才能访问远程数据。
网络延迟： 网络延迟会影响查询性能。尽量选择网络连接稳定的服务器，以减少网络延迟。
错误处理： 在应用程序中添加适当的错误处理机制，以便在连接失败或查询出错时能够及时发现并处理。
存储过程和函数： 无法在 FEDERATED 表上使用存储过程和函数。
事务： FEDERATED 引擎对事务的支持有限。如果需要跨服务器的事务支持，需要考虑其他方案，例如分布式事务。
CONNECTION 字符串安全： 避免在代码中硬编码连接字符串。建议将连接信息存储在配置文件或环境变量中，并进行加密处理。
CONNECTION字符串字符集： 如果远程数据库的字符集与本地数据库的字符集不同，需要在 CONNECTION 字符串中指定字符集，例如 CONNECTION='mysql://user:password@host/db/table?characterEncoding=utf8'
批量操作: 尽量避免在 FEDERATED 表上执行大量的 INSERT, UPDATE, DELETE 操作，因为这些操作会增加网络开销，影响性能。

7. `FEDERATED` 引擎与其他跨数据库查询方案的比较

除了 FEDERATED 引擎，还有其他一些可以实现跨数据库查询的方案，例如：

方案	优点	缺点	适用场景
`FEDERATED` 引擎	无需数据复制，实时数据访问，简化数据集成	依赖网络连接，性能瓶颈，事务支持有限，配置复杂	适合于需要实时访问远程数据，且数据量不大，网络连接稳定的场景。
ETL (Extract, Transform, Load)	可以对数据进行清洗、转换和集成，灵活性高	需要进行数据复制，实时性差，需要额外的 ETL 工具和开发工作	适合于需要将数据从多个来源抽取到数据仓库中进行分析和报表，对实时性要求不高的场景。
数据复制 (Replication)	数据备份和恢复，读写分离，提高查询性能	需要进行数据复制，数据同步存在延迟，需要额外的配置和维护工作	适合于需要将数据从主服务器复制到从服务器，实现读写分离，提高查询性能，或者进行数据备份和恢复的场景。
中间件 (Middleware)	提供统一的数据访问接口，屏蔽底层数据库的差异，支持多种数据库类型	需要引入额外的中间件，增加系统的复杂性，可能存在性能瓶颈	适合于需要访问多种数据库类型，且需要统一的数据访问接口的场景。
应用程序代码	灵活性高，可以根据需要定制查询逻辑	需要编写大量的代码，维护成本高，容易出错	适合于需要进行复杂的跨数据库查询逻辑，且没有其他合适的方案的场景。

选择哪种方案取决于具体的应用场景和需求。 FEDERATED 引擎适用于需要实时访问远程数据，且数据量不大，网络连接稳定的场景。如果需要进行复杂的数据转换和集成，或者对实时性要求不高，可以考虑使用 ETL。如果需要将数据从主服务器复制到从服务器，实现读写分离，可以考虑使用数据复制。

8. 案例分析：跨库报表

假设我们有一个电商系统，订单数据存储在一个独立的数据库 order_db 中，用户信息存储在另一个独立的数据库 user_db 中。现在我们需要生成一个报表，显示每个用户的订单总金额。

可以使用 FEDERATED 引擎来实现这个报表。

首先，在报表服务器上创建两个 FEDERATED 表，分别指向 order_db 中的 orders 表和 user_db 中的 users 表。

-- 指向 order_db.orders
CREATE TABLE `federated_orders` (
  `id` INT(11) NOT NULL,
  `user_id` INT(11) DEFAULT NULL,
  `order_amount` DECIMAL(10,2) DEFAULT NULL,
  `order_date` DATETIME DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=FEDERATED
CONNECTION='mysql://federated_user:password@order_db_host:3306/order_db/orders';

-- 指向 user_db.users
CREATE TABLE `federated_users` (
  `id` INT(11) NOT NULL,
  `username` VARCHAR(255) DEFAULT NULL,
  `email` VARCHAR(255) DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=FEDERATED
CONNECTION='mysql://federated_user:password@user_db_host:3306/user_db/users';

然后，可以使用以下 SQL 语句生成报表：

SELECT
  u.username,
  SUM(o.order_amount) AS total_order_amount
FROM
  federated_users u
JOIN
  federated_orders o ON u.id = o.user_id
GROUP BY
  u.username
ORDER BY
  total_order_amount DESC;

这条 SQL 语句会将查询转发到 order_db 和 user_db，然后将结果返回给报表服务器。

9. 总结： `FEDERATED` 的价值与局限

FEDERATED 存储引擎提供了一种在 MySQL 中实现跨数据库查询的便捷方式，尤其适用于数据量不大且网络连接稳定的场景。但它也存在一些局限性，例如依赖网络连接、性能瓶颈和事务支持有限。在选择使用 FEDERATED 引擎之前，需要仔细评估其优缺点，并结合具体的应用场景进行权衡。只有充分理解其工作原理和使用注意事项，才能更好地利用它来解决实际问题。

MySQL FEDERATED 存储引擎：跨数据库查询的艺术

1. FEDERATED 引擎简介

1.1 优点

1.2 缺点

2. 配置 FEDERATED 引擎

2.1 检查 FEDERATED 引擎是否启用

2.2 启用 FEDERATED 引擎

2.3 创建用户并授权访问远程数据库

3. 创建 FEDERATED 表

4. 查询 FEDERATED 表