案例研究

FotoLabs AI

WhatsApp 原生 AI 照片生成平台。用户发送自拍,获得 3 分钟内训练完成的个性化 AI 模型,然后生成 30 天的逼真照片。

~3 分钟

LoRA 模型训练时间

5

AI 模型在流水线中

3

支持的语言

$19.99

/月订阅

生产环境(已更名为 fenado.ai)
FotoLabs AI 深色主题营销网站

挑战

在 WhatsApp 中构建完整的 SaaS 产品

客户想要一个零摩擦的 AI 照片生成产品。无需下载应用。无需网站登录。无需引导页面。整个客户旅程,从首次联系到付款再到接收 AI 生成的照片,都必须在 WhatsApp 消息中完成。

这意味着要在对话界面中构建订阅计费、AI 模型训练、内容审核和图片交付。用户向 WhatsApp 号码发送 5-15 张自拍,通过聊天中的 Stripe 链接支付 $19.99/月,然后输入提示词在任何场景中生成自己的逼真照片。

系统还需要处理被放弃的结账并自动发送折扣优惠券,每天向每位订阅者交付一张 AI 生成的照片,并支持三种语言:英语、葡萄牙语和马来语。

我们构建的内容

WhatsApp 即产品

WhatsApp Business API 作为 UI 层

整个产品通过 Meta Graph API v20.0 运行。用户向 WhatsApp 号码发消息即可开始。系统以交互按钮、图片轮播和支付链接回复。传统应用的每个页面,引导、设置、计费、照片库,都以对话流的形式存在。用户永远不需要打开浏览器或下载应用。

FotoLabs AI 产品界面展示 WhatsApp 原生照片生成

3 分钟内完成个性化 AI 模型训练

用户通过 WhatsApp 上传 5-15 张自拍。系统将每张图片发送到 Fal.ai,在 Flux 上创建 LoRA 微调。训练在大约 3 分钟内完成。之后,用户拥有一个个性化模型,可以在他们描述的任何场景中生成逼真照片。模型在订阅期间持续有效。

// 用户通过 WhatsApp 发送 12 张自拍

state: imagesIncomplete

images received: 12/5 (min)

// 通过 Stripe 确认付款

state: generatingModel

training LoRA via Fal.ai...

// 模型在 ~3 分钟内就绪

state: photoPrompting

awaiting user prompt...

多模型 AI 流水线

每个照片生成请求经过四个 AI 系统。Groq 配合 Llama 将用户的文本提示增强为详细的图像描述。Replicate 配合 Flux 使用个性化 LoRA 模型生成图像。OpenAI GPT-4o 分析输出的质量和相关性。同一个 GPT-4o 实例在交付前进行 NSFW 审核。四个模型,一条 WhatsApp 消息作为输出。

Fal.ai

LoRA 微调训练

Replicate / Flux

图像生成

Groq / Llama

提示词增强

OpenAI / GPT-4o

审核 + 图像分析

Stripe 计费与自动化留存

Stripe 处理 $19.99/月的订阅计费。系统在 WhatsApp 内发送结账链接。Webhook 回调确认付款并将用户的状态机推进到模型训练。每小时的定时任务检测到达付费墙但未付款的用户。它生成 Stripe 优惠券并通过 WhatsApp 发送折扣码,全程无需人工干预。

// 每小时定时任务:被放弃的付费墙检查

users at paywall: 47

unpaid > 1 hour: 12

// 生成 Stripe 优惠券

coupon: FOTO-20OFF-x8k2

discount: 20%

// 通过 WhatsApp 发送

12 messages delivered

自动化与运维

  • 每日 AI 照片定时任务:每天早上系统为每位活跃订阅者生成并交付一张新的 AI 照片,无需提示词。
  • 通过 OpenAI 进行 NSFW 内容审核,在交付前检查每张生成的图片。被标记的图片会被阻止并记录。
  • 多语言支持英语、葡萄牙语和马来语。系统从用户的 WhatsApp 区域设置检测语言并以正确的语言回复。
  • 管理后台显示 WhatsApp 对话线程、用户状态、订阅状态和生成图片历史。

架构

XState 5 驱动对话

XState 5 状态机

每个 WhatsApp 用户都有一个存储在 Firebase 中的状态机实例。五个状态控制流程:onBoarding、imagesIncomplete、paywall、generatingModel 和 photoPrompting。每条传入的 WhatsApp 消息触发状态转换。状态机决定下一个响应,无论是请求更多自拍、发送支付链接还是生成图片。

Firebase 作为持久化层

Firestore 存储用户配置文件、状态机快照、订阅记录和对话历史。Firebase Storage 保存上传的自拍和生成的图片。每次状态转换都写入 Firestore,因此如果服务器在对话中重启,系统会从正确的状态恢复。

Meta Graph API v20.0

传入消息到达 webhook 端点。系统下载媒体(自拍)、处理文本(提示词),并以带有交互按钮、图片或支付链接的 WhatsApp 消息发送响应。速率限制和重试逻辑处理 Meta 的 API 限流。

Sentry 错误追踪

AI 模型训练、图像生成和 WhatsApp API 调用各有故障模式。Sentry 捕获带有完整上下文的错误:用户 ID、当前状态、导致故障的提示词以及 AI 模型的响应。团队按状态分类问题,能在几分钟内发现"付费墙后生成失败"等模式。

Next.js 14 TypeScript Tailwind CSS Framer Motion XState 5 Fal.ai Replicate Flux Groq Llama OpenAI GPT-4o Firebase Firestore Stripe WhatsApp Business API Meta Graph API Sentry

成果

已部署到生产环境

0

需要下载的应用数量

~3 分钟

个性化模型训练

5

每次请求协调的 AI 模型

3

语言:英语、葡萄牙语、马来语

联系我们

开始对话

告诉我们你的项目。我们将在 24 小时内回复,提供清晰的方案、预估时间线和价格区间。

电子邮件

hello@savibm.com

总部位于

阿联酋和印度