案例研究
FotoLabs AI
WhatsApp 原生 AI 照片生成平台。用户发送自拍,获得 3 分钟内训练完成的个性化 AI 模型,然后生成 30 天的逼真照片。
~3 分钟
LoRA 模型训练时间
5
AI 模型在流水线中
3
支持的语言
$19.99
/月订阅
挑战
在 WhatsApp 中构建完整的 SaaS 产品
客户想要一个零摩擦的 AI 照片生成产品。无需下载应用。无需网站登录。无需引导页面。整个客户旅程,从首次联系到付款再到接收 AI 生成的照片,都必须在 WhatsApp 消息中完成。
这意味着要在对话界面中构建订阅计费、AI 模型训练、内容审核和图片交付。用户向 WhatsApp 号码发送 5-15 张自拍,通过聊天中的 Stripe 链接支付 $19.99/月,然后输入提示词在任何场景中生成自己的逼真照片。
系统还需要处理被放弃的结账并自动发送折扣优惠券,每天向每位订阅者交付一张 AI 生成的照片,并支持三种语言:英语、葡萄牙语和马来语。
我们构建的内容
WhatsApp 即产品
WhatsApp Business API 作为 UI 层
整个产品通过 Meta Graph API v20.0 运行。用户向 WhatsApp 号码发消息即可开始。系统以交互按钮、图片轮播和支付链接回复。传统应用的每个页面,引导、设置、计费、照片库,都以对话流的形式存在。用户永远不需要打开浏览器或下载应用。
3 分钟内完成个性化 AI 模型训练
用户通过 WhatsApp 上传 5-15 张自拍。系统将每张图片发送到 Fal.ai,在 Flux 上创建 LoRA 微调。训练在大约 3 分钟内完成。之后,用户拥有一个个性化模型,可以在他们描述的任何场景中生成逼真照片。模型在订阅期间持续有效。
// 用户通过 WhatsApp 发送 12 张自拍
state: imagesIncomplete
images received: 12/5 (min)
// 通过 Stripe 确认付款
state: generatingModel
training LoRA via Fal.ai...
// 模型在 ~3 分钟内就绪
state: photoPrompting
awaiting user prompt...
多模型 AI 流水线
每个照片生成请求经过四个 AI 系统。Groq 配合 Llama 将用户的文本提示增强为详细的图像描述。Replicate 配合 Flux 使用个性化 LoRA 模型生成图像。OpenAI GPT-4o 分析输出的质量和相关性。同一个 GPT-4o 实例在交付前进行 NSFW 审核。四个模型,一条 WhatsApp 消息作为输出。
Fal.ai
LoRA 微调训练
Replicate / Flux
图像生成
Groq / Llama
提示词增强
OpenAI / GPT-4o
审核 + 图像分析
Stripe 计费与自动化留存
Stripe 处理 $19.99/月的订阅计费。系统在 WhatsApp 内发送结账链接。Webhook 回调确认付款并将用户的状态机推进到模型训练。每小时的定时任务检测到达付费墙但未付款的用户。它生成 Stripe 优惠券并通过 WhatsApp 发送折扣码,全程无需人工干预。
// 每小时定时任务:被放弃的付费墙检查
users at paywall: 47
unpaid > 1 hour: 12
// 生成 Stripe 优惠券
coupon: FOTO-20OFF-x8k2
discount: 20%
// 通过 WhatsApp 发送
12 messages delivered
自动化与运维
- 每日 AI 照片定时任务:每天早上系统为每位活跃订阅者生成并交付一张新的 AI 照片,无需提示词。
- 通过 OpenAI 进行 NSFW 内容审核,在交付前检查每张生成的图片。被标记的图片会被阻止并记录。
- 多语言支持英语、葡萄牙语和马来语。系统从用户的 WhatsApp 区域设置检测语言并以正确的语言回复。
- 管理后台显示 WhatsApp 对话线程、用户状态、订阅状态和生成图片历史。
架构
XState 5 驱动对话
XState 5 状态机
每个 WhatsApp 用户都有一个存储在 Firebase 中的状态机实例。五个状态控制流程:onBoarding、imagesIncomplete、paywall、generatingModel 和 photoPrompting。每条传入的 WhatsApp 消息触发状态转换。状态机决定下一个响应,无论是请求更多自拍、发送支付链接还是生成图片。
Firebase 作为持久化层
Firestore 存储用户配置文件、状态机快照、订阅记录和对话历史。Firebase Storage 保存上传的自拍和生成的图片。每次状态转换都写入 Firestore,因此如果服务器在对话中重启,系统会从正确的状态恢复。
Meta Graph API v20.0
传入消息到达 webhook 端点。系统下载媒体(自拍)、处理文本(提示词),并以带有交互按钮、图片或支付链接的 WhatsApp 消息发送响应。速率限制和重试逻辑处理 Meta 的 API 限流。
Sentry 错误追踪
AI 模型训练、图像生成和 WhatsApp API 调用各有故障模式。Sentry 捕获带有完整上下文的错误:用户 ID、当前状态、导致故障的提示词以及 AI 模型的响应。团队按状态分类问题,能在几分钟内发现"付费墙后生成失败"等模式。
成果
已部署到生产环境
0
需要下载的应用数量
~3 分钟
个性化模型训练
5
每次请求协调的 AI 模型
3
语言:英语、葡萄牙语、马来语
消息已收到
我们将审核您的项目,并在24小时内回复。
您也可以通过 hello@savibm.com 联系我们