केस स्टडी

FotoLabs AI

WhatsApp-नेटिव AI फोटो जनरेशन प्लेटफॉर्म। यूज़र्स सेल्फी भेजते हैं, 3 मिनट में ट्रेन किया गया पर्सनलाइज़्ड AI मॉडल पाते हैं, फिर 30 दिन तक फोटोरियलिस्टिक इमेज जनरेट करते हैं।

~3 मिनट

LoRA मॉडल ट्रेनिंग समय

5

पाइपलाइन में AI मॉडल

3

समर्थित भाषाएं

$19.99

/महीना सब्सक्रिप्शन

प्रोडक्शन (fenado.ai में नाम बदला गया)
डार्क थीम वाली FotoLabs AI मार्केटिंग साइट

चुनौती

WhatsApp के अंदर एक पूरा SaaS प्रोडक्ट

क्लाइंट को शून्य फ्रिक्शन वाला AI फोटो जनरेशन प्रोडक्ट चाहिए था। कोई ऐप डाउनलोड नहीं। कोई वेबसाइट लॉगिन नहीं। कोई ऑनबोर्डिंग स्क्रीन नहीं। पूरी कस्टमर जर्नी, पहले संपर्क से लेकर पेमेंट और AI-जनरेटेड फोटो प्राप्त करने तक, WhatsApp मैसेज के अंदर होनी थी।

इसका मतलब था सब्सक्रिप्शन बिलिंग, AI मॉडल ट्रेनिंग, कंटेंट मॉडरेशन, और इमेज डिलीवरी को एक कन्वर्सेशनल इंटरफ़ेस में बनाना। यूज़र्स एक WhatsApp नंबर पर 5-15 सेल्फी भेजेंगे, चैट में Stripe लिंक से $19.99/महीना पे करेंगे, फिर किसी भी सेटिंग में अपनी फोटोरियलिस्टिक इमेज जनरेट करने के लिए प्रॉम्प्ट टाइप करेंगे।

सिस्टम को ऑटोमेटेड डिस्काउंट कूपन के साथ अबैंडन्ड चेकआउट हैंडल करने, हर सब्सक्राइबर को रोज़ एक AI-जनरेटेड फोटो डिलीवर करने, और तीन भाषाओं को सपोर्ट करने की ज़रूरत थी: अंग्रेज़ी, पुर्तगाली और मलय।

हमने क्या बनाया

WhatsApp ही प्रोडक्ट है

WhatsApp Business API UI लेयर के रूप में

पूरा प्रोडक्ट Meta Graph API v20.0 के ज़रिए चलता है। यूज़र्स शुरू करने के लिए एक WhatsApp नंबर पर मैसेज करते हैं। सिस्टम इंटरैक्टिव बटन, इमेज कैरोसेल और पेमेंट लिंक के साथ जवाब देता है। एक ट्रेडिशनल ऐप की हर स्क्रीन, ऑनबोर्डिंग, सेटिंग्स, बिलिंग, फोटो गैलरी, एक कन्वर्सेशन फ्लो के रूप में मौजूद है। यूज़र्स कभी ब्राउज़र नहीं खोलते और कोई ऐप डाउनलोड नहीं करते।

FotoLabs AI प्रोडक्ट इंटरफ़ेस जिसमें WhatsApp-नेटिव फोटो जनरेशन दिख रहा है

3 मिनट में पर्सनलाइज़्ड AI मॉडल ट्रेनिंग

यूज़र्स WhatsApp के ज़रिए 5-15 सेल्फी अपलोड करते हैं। सिस्टम हर इमेज को Fal.ai पर भेजता है, जो Flux पर LoRA fine-tune बनाता है। ट्रेनिंग लगभग 3 मिनट में पूरी होती है। उसके बाद, यूज़र के पास एक पर्सनलाइज़्ड मॉडल होता है जो उनके बताए किसी भी सीनेरियो में उनकी फोटोरियलिस्टिक इमेज जनरेट करता है। मॉडल उनके सब्सक्रिप्शन की अवधि तक बना रहता है।

// यूज़र WhatsApp से 12 सेल्फी भेजता है

state: imagesIncomplete

images received: 12/5 (min)

// Stripe से पेमेंट कन्फर्म

state: generatingModel

training LoRA via Fal.ai...

// मॉडल ~3 मिनट में तैयार

state: photoPrompting

awaiting user prompt...

मल्टी-मॉडल AI पाइपलाइन

हर फोटो जनरेशन रिक्वेस्ट चार AI सिस्टम से गुज़रती है। Groq Llama के साथ यूज़र के टेक्स्ट प्रॉम्प्ट को विस्तृत इमेज डिस्क्रिप्शन में बढ़ाता है। Replicate Flux के साथ पर्सनलाइज़्ड LoRA मॉडल का उपयोग करके इमेज जनरेट करता है। OpenAI GPT-4o आउटपुट की क्वालिटी और रेलेवेंस का विश्लेषण करता है। वही GPT-4o इंस्टेंस डिलीवरी से पहले NSFW मॉडरेशन चलाता है। चार मॉडल, एक WhatsApp मैसेज आउटपुट के रूप में।

Fal.ai

LoRA fine-tune ट्रेनिंग

Replicate / Flux

इमेज जनरेशन

Groq / Llama

प्रॉम्प्ट एन्हांसमेंट

OpenAI / GPT-4o

मॉडरेशन + इमेज एनालिसिस

Stripe बिलिंग और ऑटोमेटेड रिटेंशन

Stripe $19.99/महीने पर सब्सक्रिप्शन बिलिंग हैंडल करता है। सिस्टम WhatsApp के अंदर चेकआउट लिंक भेजता है। Webhook कॉलबैक पेमेंट कन्फर्म करते हैं और यूज़र की स्टेट मशीन को मॉडल ट्रेनिंग पर ले जाते हैं। एक हर घंटे का cron जॉब उन यूज़र्स का पता लगाता है जो paywall तक पहुंचे लेकिन पे नहीं किया। यह Stripe कूपन जनरेट करता है और WhatsApp के ज़रिए डिस्काउंट कोड भेजता है, सब बिना किसी मानवीय हस्तक्षेप के।

// हर घंटे cron: अबैंडन्ड paywall चेक

users at paywall: 47

unpaid > 1 hour: 12

// Stripe कूपन जनरेट करें

coupon: FOTO-20OFF-x8k2

discount: 20%

// WhatsApp से भेजें

12 messages delivered

ऑटोमेशन और ऑपरेशंस

  • डेली AI फोटो cron: हर सुबह सिस्टम हर एक्टिव सब्सक्राइबर के लिए एक नई AI फोटो जनरेट और डिलीवर करता है, कोई प्रॉम्प्ट ज़रूरी नहीं।
  • OpenAI के ज़रिए NSFW कंटेंट मॉडरेशन हर जनरेटेड इमेज को डिलीवरी से पहले स्क्रीन करता है। फ्लैग की गई इमेज ब्लॉक और लॉग की जाती हैं।
  • अंग्रेज़ी, पुर्तगाली और मलय के लिए मल्टी-लैंग्वेज सपोर्ट। सिस्टम यूज़र की भाषा उनके WhatsApp लोकेल से डिटेक्ट करता है और सही भाषा में जवाब देता है।
  • एडमिन डैशबोर्ड जिसमें WhatsApp कन्वर्सेशन थ्रेड, यूज़र स्टेट, सब्सक्रिप्शन स्टेटस और जनरेटेड इमेज हिस्ट्री दिखती है।

आर्किटेक्चर

XState 5 कन्वर्सेशन को ड्राइव करता है

XState 5 स्टेट मशीन

हर WhatsApp यूज़र की Firebase में स्टोर्ड एक स्टेट मशीन इंस्टेंस है। पांच स्टेट फ्लो कंट्रोल करते हैं: onBoarding, imagesIncomplete, paywall, generatingModel, और photoPrompting। हर इनकमिंग WhatsApp मैसेज एक स्टेट ट्रांज़िशन ट्रिगर करता है। मशीन अगला रिस्पॉन्स तय करती है, चाहे वो और सेल्फी मांगना हो, पेमेंट लिंक भेजना हो, या इमेज जनरेट करना हो।

Firebase पर्सिस्टेंस लेयर के रूप में

Firestore यूज़र प्रोफाइल, स्टेट मशीन स्नैपशॉट, सब्सक्रिप्शन रिकॉर्ड और कन्वर्सेशन हिस्ट्री स्टोर करता है। Firebase Storage अपलोड की गई सेल्फी और जनरेटेड इमेज रखता है। हर स्टेट ट्रांज़िशन Firestore में लिखता है, इसलिए अगर सर्वर कन्वर्सेशन के बीच रीस्टार्ट होता है तो सिस्टम सही स्टेट से रिज़्यूम करता है।

Meta Graph API v20.0

इनकमिंग मैसेज एक webhook एंडपॉइंट पर आते हैं। सिस्टम मीडिया (सेल्फी) डाउनलोड करता है, टेक्स्ट (प्रॉम्प्ट) प्रोसेस करता है, और इंटरैक्टिव बटन, इमेज या पेमेंट लिंक के साथ WhatsApp मैसेज के रूप में रिस्पॉन्स भेजता है। रेट लिमिटिंग और रिट्राई लॉजिक Meta की API थ्रॉटलिंग को हैंडल करते हैं।

Sentry एरर ट्रैकिंग के लिए

AI मॉडल ट्रेनिंग, इमेज जनरेशन और WhatsApp API कॉल्स के अलग-अलग फ़ेल्योर मोड हैं। Sentry पूरे कॉन्टेक्स्ट के साथ एरर कैप्चर करता है: यूज़र ID, करंट स्टेट, फ़ेल्योर का कारण बनने वाला प्रॉम्प्ट, और AI मॉडल का रिस्पॉन्स। टीम स्टेट के अनुसार इश्यूज़ ट्रायएज करती है, ताकि "paywall के बाद जनरेशन फ़ेल" जैसे पैटर्न मिनटों में पहचाने जा सकें।

Next.js 14 TypeScript Tailwind CSS Framer Motion XState 5 Fal.ai Replicate Flux Groq Llama OpenAI GPT-4o Firebase Firestore Stripe WhatsApp Business API Meta Graph API Sentry

परिणाम

प्रोडक्शन में शिप किया

0

ऐप डाउनलोड ज़रूरी

~3 मिनट

पर्सनलाइज़्ड मॉडल ट्रेनिंग

5

प्रति रिक्वेस्ट ऑर्केस्ट्रेटेड AI मॉडल

3

भाषाएं: अंग्रेज़ी, पुर्तगाली, मलय

संपर्क करें

बातचीत शुरू करें

हमें अपने प्रोजेक्ट के बारे में बताएं। हम 24 घंटे के भीतर एक स्पष्ट योजना, अनुमानित समयसीमा और मूल्य सीमा के साथ जवाब देंगे।

ईमेल

hello@savibm.com

स्थित

UAE और भारत