केस स्टडी
FotoLabs AI
WhatsApp-नेटिव AI फोटो जनरेशन प्लेटफॉर्म। यूज़र्स सेल्फी भेजते हैं, 3 मिनट में ट्रेन किया गया पर्सनलाइज़्ड AI मॉडल पाते हैं, फिर 30 दिन तक फोटोरियलिस्टिक इमेज जनरेट करते हैं।
~3 मिनट
LoRA मॉडल ट्रेनिंग समय
5
पाइपलाइन में AI मॉडल
3
समर्थित भाषाएं
$19.99
/महीना सब्सक्रिप्शन
चुनौती
WhatsApp के अंदर एक पूरा SaaS प्रोडक्ट
क्लाइंट को शून्य फ्रिक्शन वाला AI फोटो जनरेशन प्रोडक्ट चाहिए था। कोई ऐप डाउनलोड नहीं। कोई वेबसाइट लॉगिन नहीं। कोई ऑनबोर्डिंग स्क्रीन नहीं। पूरी कस्टमर जर्नी, पहले संपर्क से लेकर पेमेंट और AI-जनरेटेड फोटो प्राप्त करने तक, WhatsApp मैसेज के अंदर होनी थी।
इसका मतलब था सब्सक्रिप्शन बिलिंग, AI मॉडल ट्रेनिंग, कंटेंट मॉडरेशन, और इमेज डिलीवरी को एक कन्वर्सेशनल इंटरफ़ेस में बनाना। यूज़र्स एक WhatsApp नंबर पर 5-15 सेल्फी भेजेंगे, चैट में Stripe लिंक से $19.99/महीना पे करेंगे, फिर किसी भी सेटिंग में अपनी फोटोरियलिस्टिक इमेज जनरेट करने के लिए प्रॉम्प्ट टाइप करेंगे।
सिस्टम को ऑटोमेटेड डिस्काउंट कूपन के साथ अबैंडन्ड चेकआउट हैंडल करने, हर सब्सक्राइबर को रोज़ एक AI-जनरेटेड फोटो डिलीवर करने, और तीन भाषाओं को सपोर्ट करने की ज़रूरत थी: अंग्रेज़ी, पुर्तगाली और मलय।
हमने क्या बनाया
WhatsApp ही प्रोडक्ट है
WhatsApp Business API UI लेयर के रूप में
पूरा प्रोडक्ट Meta Graph API v20.0 के ज़रिए चलता है। यूज़र्स शुरू करने के लिए एक WhatsApp नंबर पर मैसेज करते हैं। सिस्टम इंटरैक्टिव बटन, इमेज कैरोसेल और पेमेंट लिंक के साथ जवाब देता है। एक ट्रेडिशनल ऐप की हर स्क्रीन, ऑनबोर्डिंग, सेटिंग्स, बिलिंग, फोटो गैलरी, एक कन्वर्सेशन फ्लो के रूप में मौजूद है। यूज़र्स कभी ब्राउज़र नहीं खोलते और कोई ऐप डाउनलोड नहीं करते।
3 मिनट में पर्सनलाइज़्ड AI मॉडल ट्रेनिंग
यूज़र्स WhatsApp के ज़रिए 5-15 सेल्फी अपलोड करते हैं। सिस्टम हर इमेज को Fal.ai पर भेजता है, जो Flux पर LoRA fine-tune बनाता है। ट्रेनिंग लगभग 3 मिनट में पूरी होती है। उसके बाद, यूज़र के पास एक पर्सनलाइज़्ड मॉडल होता है जो उनके बताए किसी भी सीनेरियो में उनकी फोटोरियलिस्टिक इमेज जनरेट करता है। मॉडल उनके सब्सक्रिप्शन की अवधि तक बना रहता है।
// यूज़र WhatsApp से 12 सेल्फी भेजता है
state: imagesIncomplete
images received: 12/5 (min)
// Stripe से पेमेंट कन्फर्म
state: generatingModel
training LoRA via Fal.ai...
// मॉडल ~3 मिनट में तैयार
state: photoPrompting
awaiting user prompt...
मल्टी-मॉडल AI पाइपलाइन
हर फोटो जनरेशन रिक्वेस्ट चार AI सिस्टम से गुज़रती है। Groq Llama के साथ यूज़र के टेक्स्ट प्रॉम्प्ट को विस्तृत इमेज डिस्क्रिप्शन में बढ़ाता है। Replicate Flux के साथ पर्सनलाइज़्ड LoRA मॉडल का उपयोग करके इमेज जनरेट करता है। OpenAI GPT-4o आउटपुट की क्वालिटी और रेलेवेंस का विश्लेषण करता है। वही GPT-4o इंस्टेंस डिलीवरी से पहले NSFW मॉडरेशन चलाता है। चार मॉडल, एक WhatsApp मैसेज आउटपुट के रूप में।
Fal.ai
LoRA fine-tune ट्रेनिंग
Replicate / Flux
इमेज जनरेशन
Groq / Llama
प्रॉम्प्ट एन्हांसमेंट
OpenAI / GPT-4o
मॉडरेशन + इमेज एनालिसिस
Stripe बिलिंग और ऑटोमेटेड रिटेंशन
Stripe $19.99/महीने पर सब्सक्रिप्शन बिलिंग हैंडल करता है। सिस्टम WhatsApp के अंदर चेकआउट लिंक भेजता है। Webhook कॉलबैक पेमेंट कन्फर्म करते हैं और यूज़र की स्टेट मशीन को मॉडल ट्रेनिंग पर ले जाते हैं। एक हर घंटे का cron जॉब उन यूज़र्स का पता लगाता है जो paywall तक पहुंचे लेकिन पे नहीं किया। यह Stripe कूपन जनरेट करता है और WhatsApp के ज़रिए डिस्काउंट कोड भेजता है, सब बिना किसी मानवीय हस्तक्षेप के।
// हर घंटे cron: अबैंडन्ड paywall चेक
users at paywall: 47
unpaid > 1 hour: 12
// Stripe कूपन जनरेट करें
coupon: FOTO-20OFF-x8k2
discount: 20%
// WhatsApp से भेजें
12 messages delivered
ऑटोमेशन और ऑपरेशंस
- डेली AI फोटो cron: हर सुबह सिस्टम हर एक्टिव सब्सक्राइबर के लिए एक नई AI फोटो जनरेट और डिलीवर करता है, कोई प्रॉम्प्ट ज़रूरी नहीं।
- OpenAI के ज़रिए NSFW कंटेंट मॉडरेशन हर जनरेटेड इमेज को डिलीवरी से पहले स्क्रीन करता है। फ्लैग की गई इमेज ब्लॉक और लॉग की जाती हैं।
- अंग्रेज़ी, पुर्तगाली और मलय के लिए मल्टी-लैंग्वेज सपोर्ट। सिस्टम यूज़र की भाषा उनके WhatsApp लोकेल से डिटेक्ट करता है और सही भाषा में जवाब देता है।
- एडमिन डैशबोर्ड जिसमें WhatsApp कन्वर्सेशन थ्रेड, यूज़र स्टेट, सब्सक्रिप्शन स्टेटस और जनरेटेड इमेज हिस्ट्री दिखती है।
आर्किटेक्चर
XState 5 कन्वर्सेशन को ड्राइव करता है
XState 5 स्टेट मशीन
हर WhatsApp यूज़र की Firebase में स्टोर्ड एक स्टेट मशीन इंस्टेंस है। पांच स्टेट फ्लो कंट्रोल करते हैं: onBoarding, imagesIncomplete, paywall, generatingModel, और photoPrompting। हर इनकमिंग WhatsApp मैसेज एक स्टेट ट्रांज़िशन ट्रिगर करता है। मशीन अगला रिस्पॉन्स तय करती है, चाहे वो और सेल्फी मांगना हो, पेमेंट लिंक भेजना हो, या इमेज जनरेट करना हो।
Firebase पर्सिस्टेंस लेयर के रूप में
Firestore यूज़र प्रोफाइल, स्टेट मशीन स्नैपशॉट, सब्सक्रिप्शन रिकॉर्ड और कन्वर्सेशन हिस्ट्री स्टोर करता है। Firebase Storage अपलोड की गई सेल्फी और जनरेटेड इमेज रखता है। हर स्टेट ट्रांज़िशन Firestore में लिखता है, इसलिए अगर सर्वर कन्वर्सेशन के बीच रीस्टार्ट होता है तो सिस्टम सही स्टेट से रिज़्यूम करता है।
Meta Graph API v20.0
इनकमिंग मैसेज एक webhook एंडपॉइंट पर आते हैं। सिस्टम मीडिया (सेल्फी) डाउनलोड करता है, टेक्स्ट (प्रॉम्प्ट) प्रोसेस करता है, और इंटरैक्टिव बटन, इमेज या पेमेंट लिंक के साथ WhatsApp मैसेज के रूप में रिस्पॉन्स भेजता है। रेट लिमिटिंग और रिट्राई लॉजिक Meta की API थ्रॉटलिंग को हैंडल करते हैं।
Sentry एरर ट्रैकिंग के लिए
AI मॉडल ट्रेनिंग, इमेज जनरेशन और WhatsApp API कॉल्स के अलग-अलग फ़ेल्योर मोड हैं। Sentry पूरे कॉन्टेक्स्ट के साथ एरर कैप्चर करता है: यूज़र ID, करंट स्टेट, फ़ेल्योर का कारण बनने वाला प्रॉम्प्ट, और AI मॉडल का रिस्पॉन्स। टीम स्टेट के अनुसार इश्यूज़ ट्रायएज करती है, ताकि "paywall के बाद जनरेशन फ़ेल" जैसे पैटर्न मिनटों में पहचाने जा सकें।
परिणाम
प्रोडक्शन में शिप किया
0
ऐप डाउनलोड ज़रूरी
~3 मिनट
पर्सनलाइज़्ड मॉडल ट्रेनिंग
5
प्रति रिक्वेस्ट ऑर्केस्ट्रेटेड AI मॉडल
3
भाषाएं: अंग्रेज़ी, पुर्तगाली, मलय
संपर्क करें
बातचीत शुरू करें
हमें अपने प्रोजेक्ट के बारे में बताएं। हम 24 घंटे के भीतर एक स्पष्ट योजना, अनुमानित समयसीमा और मूल्य सीमा के साथ जवाब देंगे।
ईमेल
hello@savibm.comस्थित
UAE और भारत
संदेश प्राप्त हुआ
हम आपके प्रोजेक्ट की समीक्षा करेंगे और 24 घंटे के भीतर जवाब देंगे।
आप हमें hello@savibm.com पर भी संपर्क कर सकते हैं