C++ FFI (Foreign Function Interface)：与其他语言的互操作性 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

好的，各位编程界的“后浪”们，今天咱们来聊聊C++的FFI，也就是“Foreign Function Interface”，俗称“跨国婚姻”。啥意思呢？就是让C++程序能跟其他语言写的程序“眉来眼去”，甚至“喜结连理”。

开场白：C++，你不是一个人在战斗！

C++虽然很强大，但也不是万能的。有些时候，我们需要借助其他语言的优势，比如Python的脚本能力、Java的跨平台特性、甚至JavaScript的前端展示。这时候，FFI就派上用场了。

想象一下，你用C++写了一个高性能的图像处理库，但是你的同事只会Python，难道要让他重写一遍？No way! 用FFI，让Python直接调用你的C++库，岂不美哉？

第一部分：FFI是个啥？

简单来说，FFI就是一种机制，允许一种编程语言调用另一种编程语言编写的函数或代码。它就像一个翻译器，把不同语言的指令翻译成对方能听懂的“暗号”。

为啥要用FFI？

重用现有代码： 避免重复造轮子，直接调用其他语言的库。
利用不同语言的优势： C++性能高，Python开发快，各取所长。
集成不同系统的功能： 连接C++程序和用其他语言编写的系统组件。

FFI的常见实现方式

技术方案	优点	缺点	适用场景
C接口	简单，通用，几乎所有语言都支持C接口。	需要手动管理内存，容易出错。类型系统简单，缺乏高级特性。	对性能要求高，需要与其他语言交互的场景。例如，C++库被Python/Java调用。
COM/DCOM	微软的技术，支持Windows平台。支持对象模型，易于组件化。	仅限于Windows平台。配置复杂，学习曲线陡峭。	Windows平台上的组件化开发。
CORBA	跨平台，支持分布式对象。	复杂，重量级。性能不如C接口。	大型分布式系统。
SWIG	简化了C/C++与其他语言的接口生成过程。支持多种目标语言。	需要学习SWIG的语法。可能会引入额外的依赖。	需要将C/C++库暴露给多种语言的场景。
Boost.Python	专门为C++和Python设计的库，提供了方便的C++到Python的接口。	仅限于Python。需要引入Boost库。	C++和Python的混合开发。
JNI	Java Native Interface，允许Java代码调用C/C++代码。	仅限于Java。需要编写额外的JNI代码。	Java需要调用底层C/C++代码的场景。
gRPC	Google开发的RPC框架，支持多种语言。基于Protocol Buffers，性能高。	需要定义Protocol Buffers。配置相对复杂。	微服务架构，需要跨语言的服务调用。
WebAssembly	一种新的二进制指令格式，可以在Web浏览器中运行高性能代码。	需要将C/C++代码编译成WebAssembly。目前生态系统还在发展中。	需要在Web浏览器中运行高性能C/C++代码的场景。
Rust FFI	Rust语言提供的FFI功能，可以与其他语言交互。Rust的内存安全特性可以减少FFI中的错误。	需要学习Rust语言。	需要与其他语言交互，并需要保证内存安全的场景。
C++/CLI	微软的.NET平台上的C++扩展，可以与C#等.NET语言交互。	仅限于.NET平台。	.NET平台上的C++和其他.NET语言的混合开发。

第二部分：C接口——FFI的“普通话”

C语言是编程界的“普通话”，几乎所有语言都支持C接口。所以，最常用的FFI方式就是通过C接口来实现。

C接口的原理

C接口本质上就是一组函数声明，这些函数用C语言的ABI（Application Binary Interface）进行编译。其他语言可以通过链接这些编译后的C接口，调用C++代码。

C++代码 (cpp_lib.cpp)

#include <iostream>
#include <string>

// 为了避免C++的name mangling，使用extern "C"
extern "C" {

// 一个简单的加法函数
int add(int a, int b) {
    return a + b;
}

// 一个字符串拼接函数
char* concat(const char* str1, const char* str2) {
    std::string result = std::string(str1) + str2;
    char* c_result = new char[result.length() + 1];
    strcpy(c_result, result.c_str());
    return c_result;
}

// 释放字符串内存的函数
void free_string(char* str) {
    delete[] str;
}

} // extern "C"

代码解释：

extern "C"：这是关键！它告诉编译器，这段代码要按照C语言的ABI进行编译，避免C++的name mangling。Name mangling是C++编译器为了支持函数重载而采用的一种机制，它会改变函数的名字，导致其他语言无法找到正确的函数。
add函数：一个简单的加法函数，接受两个整数作为参数，返回它们的和。
concat函数：一个字符串拼接函数，接受两个C风格的字符串作为参数，返回拼接后的字符串。注意，这里使用了new来分配内存，所以需要提供一个free_string函数来释放内存，避免内存泄漏。
free_string函数：释放concat函数分配的内存。

编译C++代码

使用g++编译器将C++代码编译成动态链接库：

g++ -shared -fPIC cpp_lib.cpp -o libcpp_lib.so

-shared：生成动态链接库。
-fPIC：生成位置无关代码，使得动态链接库可以在任何内存地址加载。
cpp_lib.cpp：C++源代码文件。
libcpp_lib.so：生成的动态链接库文件（Linux系统）。Windows系统下会生成cpp_lib.dll文件。

Python代码 (main.py)

import ctypes

# 加载动态链接库
lib = ctypes.CDLL('./libcpp_lib.so')  # Linux
# lib = ctypes.CDLL('./cpp_lib.dll')  # Windows

# 定义C函数的参数类型和返回类型
lib.add.argtypes = [ctypes.c_int, ctypes.c_int]
lib.add.restype = ctypes.c_int

lib.concat.argtypes = [ctypes.c_char_p, ctypes.c_char_p]
lib.concat.restype = ctypes.c_char_p

lib.free_string.argtypes = [ctypes.c_char_p]
lib.free_string.restype = None

# 调用C++函数
result = lib.add(10, 20)
print(f"10 + 20 = {result}")

str1 = "Hello, "
str2 = "Python!"
c_str1 = str1.encode('utf-8')
c_str2 = str2.encode('utf-8')
c_result = lib.concat(c_str1, c_str2)
py_result = c_result.decode('utf-8')
print(f"Concatenated string: {py_result}")

# 释放C++分配的内存
lib.free_string(c_result)

代码解释：

ctypes：Python的标准库，用于调用C函数。
ctypes.CDLL：加载动态链接库。
lib.add.argtypes和lib.add.restype：定义C函数的参数类型和返回类型。这很重要，因为Python需要知道如何将数据传递给C函数，以及如何处理C函数的返回值。
encode('utf-8')：将Python字符串编码成UTF-8格式的字节串，因为C语言使用C风格的字符串，也就是以null结尾的字符数组。
decode('utf-8')：将C风格的字符串解码成Python字符串。
lib.free_string(c_result)：释放C++分配的内存。

运行Python代码

python3 main.py

输出结果：

10 + 20 = 30
Concatenated string: Hello, Python!

注意事项：

内存管理： 这是FFI中最容易出错的地方！C++和Python有不同的内存管理机制。C++需要手动管理内存，而Python有垃圾回收机制。如果C++分配的内存没有被正确释放，就会导致内存泄漏。反之，如果Python的垃圾回收器回收了C++正在使用的内存，就会导致程序崩溃。
类型转换： C++和Python有不同的数据类型。需要进行类型转换，才能将数据从Python传递给C++，以及从C++返回给Python。
异常处理： C++的异常机制和Python的异常机制不同。需要进行转换，才能将C++的异常传递给Python，以及从Python传递给C++。

第三部分：SWIG——FFI的“自动化工厂”

SWIG（Simplified Wrapper and Interface Generator）是一个强大的工具，可以自动生成C/C++代码与其他语言的接口。它可以简化FFI的开发过程，减少手动编写接口代码的工作量。

SWIG的原理

SWIG读取一个接口文件（通常以.i为后缀），该文件描述了C/C++代码中需要暴露给其他语言的函数和类型。SWIG根据这个接口文件，生成目标语言的包装代码。

C++代码 (cpp_lib.cpp, 同上)

#include <iostream>
#include <string>

// 为了避免C++的name mangling，使用extern "C"
extern "C" {

// 一个简单的加法函数
int add(int a, int b) {
    return a + b;
}

// 一个字符串拼接函数
char* concat(const char* str1, const char* str2) {
    std::string result = std::string(str1) + str2;
    char* c_result = new char[result.length() + 1];
    strcpy(c_result, result.c_str());
    return c_result;
}

// 释放字符串内存的函数
void free_string(char* str) {
    delete[] str;
}

} // extern "C"

接口文件 (cpp_lib.i)

/* cpp_lib.i */
%module cpp_lib

%{
#include "cpp_lib.h"
%}

/* 包括头文件，SWIG会根据头文件生成接口 */
%include "cpp_lib.h"

头文件 (cpp_lib.h)

#ifndef CPP_LIB_H
#define CPP_LIB_H

#ifdef __cplusplus
extern "C" {
#endif

int add(int a, int b);
char* concat(const char* str1, const char* str2);
void free_string(char* str);

#ifdef __cplusplus
}
#endif

#endif

代码解释：

%module cpp_lib：定义模块的名字，也就是Python中import的名字。
%{ #include "cpp_lib.h" %}：包含C++头文件，SWIG会根据头文件生成接口代码。
%include "cpp_lib.h"：包含C++头文件，SWIG会根据头文件生成接口代码。

生成包装代码

使用SWIG生成Python的包装代码：

swig -python -c++ cpp_lib.i

-python：生成Python的包装代码。
-c++：指定C++代码。
cpp_lib.i：接口文件。

执行完这个命令后，会生成两个文件：cpp_lib_wrap.cxx和cpp_lib.py。

编译C++代码和包装代码

g++ -fPIC -c cpp_lib.cpp cpp_lib_wrap.cxx -I/usr/include/python3.8  # 这里的python3.8是你的python版本，需要根据实际情况修改
g++ -shared cpp_lib.o cpp_lib_wrap.o -o _cpp_lib.so

-I/usr/include/python3.8：指定Python头文件的路径。需要根据你的Python版本修改。

Python代码 (main.py)

import cpp_lib

# 调用C++函数
result = cpp_lib.add(10, 20)
print(f"10 + 20 = {result}")

str1 = "Hello, "
str2 = "Python!"
result = cpp_lib.concat(str1, str2)
print(f"Concatenated string: {result}")

# SWIG会自动管理内存，不需要手动释放

代码解释：

import cpp_lib：导入SWIG生成的Python模块。
cpp_lib.add(10, 20)：调用C++的加法函数。
cpp_lib.concat(str1, str2)：调用C++的字符串拼接函数。
SWIG会自动管理内存，不需要手动释放。

运行Python代码

python3 main.py

输出结果：

10 + 20 = 30
Concatenated string: Hello, Python!

SWIG的优点：

自动化： 减少手动编写接口代码的工作量。
支持多种语言： 可以生成多种语言的包装代码，例如Python、Java、Perl等。
类型安全： SWIG可以进行类型检查，减少类型错误。
内存管理： SWIG可以自动管理内存，减少内存泄漏的风险。

SWIG的缺点：

需要学习SWIG的语法： SWIG有自己的语法，需要学习才能使用。
可能会引入额外的依赖： 需要安装SWIG工具。
调试困难： 如果出现问题，调试SWIG生成的代码可能会比较困难。

第四部分：Boost.Python——C++与Python的“蜜月”

Boost.Python是一个专门为C++和Python设计的库，提供了方便的C++到Python的接口。它使用C++模板元编程技术，可以自动生成Python的包装代码。

Boost.Python的原理

Boost.Python使用C++模板元编程技术，在编译时生成Python的包装代码。它不需要额外的接口文件，直接在C++代码中定义Python的接口。

C++代码 (cpp_lib.cpp)

#include <boost/python.hpp>
#include <iostream>
#include <string>

using namespace boost::python;

// 一个简单的加法函数
int add(int a, int b) {
    return a + b;
}

// 一个字符串拼接函数
std::string concat(const std::string& str1, const std::string& str2) {
    return str1 + str2;
}

// 定义Python模块
BOOST_PYTHON_MODULE(cpp_lib) {
    def("add", add);
    def("concat", concat);
}

代码解释：

#include <boost/python.hpp>：包含Boost.Python头文件。
using namespace boost::python：使用Boost.Python的命名空间。
BOOST_PYTHON_MODULE(cpp_lib)：定义Python模块的名字。
def("add", add)：将C++的add函数暴露给Python，并命名为add。
def("concat", concat)：将C++的concat函数暴露给Python，并命名为concat。

编译C++代码

g++ -shared -fPIC cpp_lib.cpp -o cpp_lib.so -I/usr/include/python3.8 -I/usr/include/boost  -lboost_python38 # 这里的python3.8是你的python版本，需要根据实际情况修改

-I/usr/include/python3.8：指定Python头文件的路径。需要根据你的Python版本修改。
-I/usr/include/boost：指定Boost头文件的路径。
-lboost_python38：链接Boost.Python库。需要根据你的Python版本修改。

Python代码 (main.py)

import cpp_lib

# 调用C++函数
result = cpp_lib.add(10, 20)
print(f"10 + 20 = {result}")

str1 = "Hello, "
str2 = "Python!"
result = cpp_lib.concat(str1, str2)
print(f"Concatenated string: {result}")

代码解释：

import cpp_lib：导入Boost.Python生成的Python模块。
cpp_lib.add(10, 20)：调用C++的加法函数。
cpp_lib.concat(str1, str2)：调用C++的字符串拼接函数。

运行Python代码

python3 main.py

输出结果：

10 + 20 = 30
Concatenated string: Hello, Python!

Boost.Python的优点：

易于使用： 不需要额外的接口文件，直接在C++代码中定义Python的接口。
类型安全： Boost.Python可以进行类型检查，减少类型错误。
自动类型转换： Boost.Python可以自动进行类型转换，例如将C++的std::string转换为Python的字符串。
支持C++的面向对象特性： 可以将C++的类暴露给Python。

Boost.Python的缺点：

仅限于Python： 只能生成Python的包装代码。
需要引入Boost库： 需要安装Boost库。
编译时间长： Boost.Python使用C++模板元编程技术，编译时间可能会比较长。

总结：选择哪个FFI方案？

选择哪个FFI方案取决于你的具体需求：

C接口： 如果你需要与其他多种语言交互，并且对性能要求很高，那么C接口是一个不错的选择。
SWIG： 如果你需要将C/C++库暴露给多种语言，并且希望减少手动编写接口代码的工作量，那么SWIG是一个不错的选择。
Boost.Python： 如果你只需要与Python交互，并且希望使用C++的面向对象特性，那么Boost.Python是一个不错的选择。

最后的忠告：

FFI虽然强大，但也不是万能的。在使用FFI时，一定要注意内存管理、类型转换和异常处理，避免出现问题。如果可能的话，尽量选择一种自动化程度较高的FFI方案，例如SWIG或Boost.Python，以减少手动编写接口代码的工作量。

好了，今天的FFI讲座就到这里。希望大家能够掌握FFI的精髓，让C++程序与其他语言的程序“和谐共处”，共同创造美好的未来！记住，编程的世界，开放合作才能共赢！

发表回复 取消回复

发表回复取消回复