RFM 模型构建与客户分群 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

各位观众老爷，各位程序猿、媛们，大家好！我是你们的老朋友，一个在代码海洋里摸爬滚打多年的老水手。今天，咱们要聊聊一个听起来高大上，用起来贼实在的玩意儿——RFM模型。

别怕，RFM不是火箭燃料模型，也不是人民币财富模型，它跟咱们的客户息息相关，是用来给咱们的客户精准画像，进行客户分群的秘密武器。

想象一下，你手里有一家淘宝店，卖各种稀奇古怪的小玩意儿。每天都有成千上万的顾客光顾，有的只是路过看看，有的买了个打火机就溜了，有的却成了你的忠实粉丝，天天在你店里剁手。

问题来了，你怎么知道谁是你的VIP，谁是潜在的VIP，谁又是那种“一次性”的顾客呢？如果你只是靠感觉，那可就危险了！毕竟，感觉这玩意儿，有时候比女人的心思还难猜。 🤔

这时候，RFM模型就派上用场了！它就像一个X光机，能穿透表象，直达客户行为的本质，帮你把客户分得明明白白。

一、RFM是什么鬼？ 🧙‍♂️

RFM，简单来说，就是三个英文单词的首字母缩写：

R (Recency): 最近一次消费（时间间隔）
F (Frequency): 消费频率
M (Monetary): 消费金额

这三个维度，就像三把手术刀，能把客户切分成不同的群体，从而让你针对不同的群体，采取不同的营销策略。

咱们来举个栗子：

R：客户A昨天刚在你店里买了东西，客户B已经一年没来了。显然，客户A比客户B更有价值，因为他/她对你的店铺还保持着“新鲜感”。
F：客户C一个月在你店里买了10次东西，客户D一年才买一次。毫无疑问，客户C对你的店铺更忠诚，消费习惯也更稳定。
M：客户E每次都买几百块的东西，客户F每次只买几块钱的小玩意儿。显而易见，客户E的消费能力更强，能给你带来更多的利润。

把这三个维度结合起来，就能对客户进行更细致的分析，从而制定更有效的营销方案。

二、RFM模型构建：代码实战 👨‍💻

光说不练假把式，咱们直接上代码！这里我们用Python来演示，毕竟Python是数据分析界的扛把子。

首先，我们需要准备一些数据。假设我们有如下的客户交易数据：

CustomerID	PurchaseDate	Amount
1	2023-10-26	100
1	2023-10-20	50
2	2023-10-25	200
3	2023-10-15	30
3	2023-10-10	20
4	2023-09-30	150
5	2023-10-27	80
5	2023-10-22	120

接下来，咱们用Python来计算每个客户的R、F、M值。

import pandas as pd
import datetime as dt

# 模拟客户交易数据
data = {'CustomerID': [1, 1, 2, 3, 3, 4, 5, 5],
        'PurchaseDate': ['2023-10-26', '2023-10-20', '2023-10-25', '2023-10-15', '2023-10-10', '2023-09-30', '2023-10-27', '2023-10-22'],
        'Amount': [100, 50, 200, 30, 20, 150, 80, 120]}

df = pd.DataFrame(data)
df['PurchaseDate'] = pd.to_datetime(df['PurchaseDate'])

# 计算最近一次消费日期
now = dt.datetime(2023, 10, 28)
df['Recency'] = now - df['PurchaseDate']
df['Recency'] = df['Recency'].dt.days # 转换成天数

# 计算消费频率
frequency = df.groupby('CustomerID')['PurchaseDate'].count().reset_index()
frequency.columns = ['CustomerID', 'Frequency']

# 计算消费金额
monetary = df.groupby('CustomerID')['Amount'].sum().reset_index()
monetary.columns = ['CustomerID', 'Monetary']

# 合并RFM数据
rfm = pd.merge(frequency, monetary, on='CustomerID')
rfm = pd.merge(rfm, df[['CustomerID', 'Recency']].drop_duplicates(), on='CustomerID')

# 打印RFM数据
print(rfm)

这段代码完成了以下几个步骤：

导入必要的库： pandas 用于数据处理，datetime 用于处理日期。
创建DataFrame： 将模拟的客户交易数据存储到DataFrame中。
转换日期格式： 将PurchaseDate列转换为日期格式。
计算Recency： 用当前日期减去客户最近一次消费的日期，得到Recency值（天数）。
计算Frequency： 统计每个客户的购买次数。
计算Monetary： 统计每个客户的消费总金额。
合并RFM数据： 将计算好的R、F、M值合并到同一个DataFrame中。

运行这段代码，你会得到一个包含每个客户R、F、M值的DataFrame。就像这样：

CustomerID	Frequency	Monetary	Recency
1	2	150	2
2	1	200	3
3	2	50	13
4	1	150	28
5	2	200	1

三、RFM分箱：化繁为简 ✂️

有了R、F、M值，咱们就可以对客户进行分箱了。分箱的目的是将连续的R、F、M值转换为离散的等级，方便后续的分群。

常用的分箱方法有两种：

等频分箱： 将数据分成若干份，每份包含相同数量的客户。
等距分箱： 将数据分成若干份，每份的范围相等。

这里我们使用等频分箱，将R、F、M值分别分成5个等级 (1-5)。等级越高，代表客户的价值越高。

# 定义分箱函数
def segment_rfm(rfm, quantiles=5):
  """对RFM值进行分箱，分为quantiles个等级"""
  rfm['R_Score'] = pd.qcut(rfm['Recency'], quantiles, labels=range(quantiles, 0, -1)) # Recency越大，得分越低
  rfm['F_Score'] = pd.qcut(rfm['Frequency'], quantiles, labels=range(1, quantiles + 1))
  rfm['M_Score'] = pd.qcut(rfm['Monetary'], quantiles, labels=range(1, quantiles + 1))
  return rfm

# 进行分箱
rfm = segment_rfm(rfm)

# 打印分箱后的RFM数据
print(rfm)

这段代码做了以下事情：

定义分箱函数： segment_rfm函数接收一个DataFrame和一个分位数参数，然后使用pd.qcut函数对R、F、M值进行等频分箱。
Recency分箱： 由于Recency值越小，客户价值越高，所以我们使用labels=range(quantiles, 0, -1)来反转等级顺序。
Frequency和Monetary分箱： Frequency和Monetary值越大，客户价值越高，所以我们使用labels=range(1, quantiles + 1)来正向排列等级顺序。
调用分箱函数： 将DataFrame和分位数参数传递给segment_rfm函数，完成分箱操作。

运行这段代码，你会得到一个包含R_Score、F_Score、M_Score的DataFrame。就像这样：

CustomerID	Frequency	Monetary	Recency	R_Score	F_Score	M_Score
1	2	150	2	5	4	3
2	1	200	3	5	1	5
3	2	50	13	3	4	1
4	1	150	28	1	1	3
5	2	200	1	5	4	5

四、RFM分群：客户画像 🎭

有了R、F、M的等级，咱们就可以对客户进行分群了。最常见的分群方法是将R、F、M的等级组合起来，形成一个RFM值。例如，如果一个客户的R_Score是5，F_Score是4，M_Score是3，那么他的RFM值就是543。

根据RFM值，我们可以将客户分成不同的群体，例如：

重要价值客户 (555): 最近消费过，消费频率高，消费金额高。
重要发展客户 (4XX): 最近消费过，但是消费频率和金额不高，有潜力成为VIP。
重要保持客户 (X5X): 消费频率高，但是最近没有消费，需要激活。
重要挽回客户 (XX5): 消费金额高，但是最近没有消费，需要重点挽回。

当然，你也可以根据自己的业务需求，自定义客户群体。

# 合并RFM得分
rfm['RFM_Score'] = rfm['R_Score'].astype(str) + rfm['F_Score'].astype(str) + rfm['M_Score'].astype(str)

# 定义客户分群函数
def segment_customer(rfm):
  """根据RFM得分进行客户分群"""
  rfm['Customer_Segment'] = '需要研究' # 默认分类

  # 重要价值客户
  rfm.loc[rfm['RFM_Score'] == '555', 'Customer_Segment'] = '重要价值客户'

  # 重要发展客户
  rfm.loc[(rfm['R_Score'] >= '4') & (rfm['F_Score'] <= '2'), 'Customer_Segment'] = '重要发展客户'

  # 重要保持客户
  rfm.loc[(rfm['F_Score'] >= '4') & (rfm['R_Score'] <= '2'), 'Customer_Segment'] = '重要保持客户'

  # 重要挽回客户
  rfm.loc[(rfm['M_Score'] >= '4') & (rfm['R_Score'] <= '2'), 'Customer_Segment'] = '重要挽回客户'

  return rfm

# 进行客户分群
rfm = segment_customer(rfm)

# 打印分群结果
print(rfm)

这段代码完成了以下几个步骤：

合并RFM得分： 将R_Score、F_Score、M_Score合并成一个字符串，作为RFM_Score。
定义客户分群函数： segment_customer函数接收一个DataFrame，然后根据RFM_Score对客户进行分群。
定义客户群体： 根据RFM_Score的组合，定义了几个常见的客户群体，例如重要价值客户、重要发展客户、重要保持客户、重要挽回客户。
进行客户分群： 将DataFrame传递给segment_customer函数，完成分群操作。

运行这段代码，你会得到一个包含Customer_Segment的DataFrame。就像这样：

CustomerID	Frequency	Monetary	Recency	R_Score	F_Score	M_Score	RFM_Score	Customer_Segment
1	2	150	2	5	4	3	543	需要研究
2	1	200	3	5	1	5	515	重要发展客户
3	2	50	13	3	4	1	341	需要研究
4	1	150	28	1	1	3	113	需要研究
5	2	200	1	5	4	5	545	需要研究

五、RFM应用：精准营销 🎯

有了客户分群的结果，咱们就可以针对不同的群体，制定不同的营销策略了。就像医生根据不同的病症开不同的药方一样。

重要价值客户： 对他们进行个性化的推荐，提供专属的优惠，让他们感受到VIP的待遇。
重要发展客户： 引导他们购买更多商品，提高消费频率和金额，让他们成为VIP。
重要保持客户： 发送促销邮件或短信，提醒他们店铺的最新活动，让他们重新回到你的店铺。
重要挽回客户： 了解他们流失的原因，提供有针对性的解决方案，例如赠送优惠券或提供更好的服务，让他们重新成为你的忠实粉丝。

六、总结：RFM的魅力 ✨

RFM模型就像一把瑞士军刀，虽然简单，但是功能强大。它可以帮助你：

了解你的客户： 通过R、F、M值，你可以了解客户的消费习惯、忠诚度和价值。
精准营销： 针对不同的客户群体，制定不同的营销策略，提高营销效果。
提高客户满意度： 通过个性化的服务和推荐，让客户感受到你的关心，提高客户满意度。
增加收入： 通过更有效的营销，提高销售额和利润。

当然，RFM模型也有一些局限性。例如，它只考虑了客户的消费行为，没有考虑客户的个人信息和偏好。因此，在实际应用中，你需要结合其他数据和方法，例如用户画像、行为分析等，才能更好地了解你的客户，制定更有效的营销策略。

好了，今天的RFM模型构建与客户分群的分享就到这里。希望大家能从中学到一些东西，并在实际工作中应用起来。记住，数据是金矿，只要你善于挖掘，就能找到意想不到的宝藏！ 💰

最后，祝大家代码无bug，升职加薪，早日实现财务自由！ 🚀

(插入一个挥手告别的表情) 👋

发表回复 取消回复

发表回复取消回复