ओपनएआई की दृष्टि और भाषण सुविधाओं का उपयोग करने के लिए एपीआई क्लाइंट

नवीनतम संस्करण

संस्करण
अद्यतन
19 दिस॰ 2023
डेवलपर
श्रेणी
Google Play ID
इंस्टॉल की संख्या
100+

App APKs

OpenAI API Client - TOM APP

TOM, ChatGPT के एपीआई के लिए सबसे संपूर्ण क्लाइंट

ChatGPT के लिए OpenAI API अब सार्वजनिक है, और TOM के साथ, आप अपने मोबाइल डिवाइस पर GPT-4 टर्बो और GPT-4 विज़न की शक्ति प्राप्त कर सकते हैं।

GPT 4 से सीधे बात करें, चर्चा शुरू करें, या फ़ोटो लें और उनके बारे में प्रश्न पूछें। आप किसी भी भाषा में बोल सकते हैं, TOM उन सभी को समझता है।

सिस्टम प्रॉम्प्ट पर टैप करके TOM के व्यवहार का तरीका बदलें। इसे अपनी इच्छानुसार कोई भी भूमिका निभाएं।

ओपनएआई के व्हिस्पर के साथ सबसे सटीक आवाज पहचान और ओपनएआई के टीटीएस के साथ पूरी तरह से मानवीय भाषण का आनंद लें। वैकल्पिक रूप से, उन्हें अक्षम रखें और कम विलंबता और लागत तथा तेज़ उपयोगकर्ता अनुभव के लिए Google की सेवाओं का उपयोग करें।

त्वरित प्रतिक्रिया और लागत कम करने के लिए आप GPT 3.5 टर्बो का भी उपयोग कर सकते हैं।

TOM मुफ़्त है और हमेशा रहेगा। लेकिन एआई का उपयोग करने के लिए आपको एआई मालिक, ओपनएआई से एक एपीआई कुंजी की आवश्यकता होगी।

एक GPT API क्लाइंट
GPT 4 Turbo या GPT 4 Vision का आनंद लेने के लिए आपको मासिक सदस्यता की आवश्यकता नहीं है: बस एक API कुंजी। और अच्छी खबर यह है कि OpenAI की साइट पर API कुंजियाँ निःशुल्क हैं। यहां बताया गया है कि शुरुआत कैसे करें:

1. https://platform.openai.com/api-keys पर अपनी एपीआई कुंजी बनाएं
2. द बीस्ट को मुक्त कराने के लिए TOM में अपनी एपीआई कुंजी का उपयोग करें

यदि किसी भी समय आपको अपने द्वारा उपयोग की जा रही एपीआई कुंजी को अपडेट करने या बदलने की आवश्यकता है, तो कुंजी बटन पर टैप करें।

नियंत्रण

अपनी लागतों को प्रबंधित करने या त्वरित प्रतिक्रिया के लिए GPT-3.5 Turbo और GPT-4 Turbo के बीच स्विच करने के लिए शीर्ष पर चयनकर्ता का उपयोग करें। जब भी आप कोई तस्वीर लेते हैं तो GPT-4 विज़न स्वचालित रूप से चयनित हो जाता है।

अपना स्वयं का सिस्टम प्रॉम्प्ट सेट करने के लिए टॉम के विवरण पर टैप करें। यह जीपीटी को आपके साथ बातचीत करने के तरीके के बारे में मार्गदर्शन देगा।

जीपीटी से बात करने के लिए स्पीक बटन पर टैप करें।
तस्वीर लेने और इसके बारे में कुछ भी पूछने के लिए कैमरा बटन पर टैप करें।
आप बाद में 'स्पीक' पर टैप करके उस फोटो पर चर्चा जारी रख सकते हैं।
हालाँकि, आपका CONTEXT बढ़ेगा।

संदर्भ क्या है?

संदर्भ में आपकी वर्तमान बातचीत में कही गई सभी बातें शामिल हैं, जिनमें ली गई तस्वीरें भी शामिल हैं। इसे हर बार एपीआई को भेजा जाता है, क्योंकि जीपीटी इसे इसी तरह याद रखता है।

यह हर नए वाक्य के साथ बढ़ता है और विशेषकर हर नई तस्वीर के साथ। एपीआई को जितना बड़ा संदर्भ भेजा जाएगा, प्रतिक्रिया समय उतना ही लंबा होगा। और महत्वपूर्ण बात यह है कि OpenAI आपके संदर्भ के आकार के आधार पर शुल्क लेता है।

सही संतुलन खोजने के लिए, टीओएम संदर्भ को साफ़ करने की क्षमता प्रदान करता है जब भी यह विशेष रूप से भारी हो जाता है, हालांकि जीपीटी तब सभी पिछले इंटरैक्शन को भूल जाएगा। इस उद्देश्य के लिए BIN बटन का उपयोग करें।

छवि आकार

TOM GPT पर भेजे गए चित्रों के लिए तीन सेटिंग्स प्रदान करता है: तेज़, मध्यम और गुणवत्ता।

'फास्ट' डिफ़ॉल्ट है, जो जीपीटी के साथ त्वरित इंटरैक्शन के लिए छोटी छवियां प्रदान करता है। यह टेक्स्ट और अधिकांश प्रकार की छवियों के साथ अच्छा काम करता है।

'मीडियम' अधिक विवरण प्रदान करता है लेकिन परिणाम थोड़े बड़े होते हैं।

सर्वाधिक सटीकता के लिए 'गुणवत्ता' का प्रयोग करें। ये छवियां OpenAI API में सबसे भारी और सबसे महंगी हैं।

व्हिस्पर और टीटीएस
व्हिस्पर एक ओपनएआई न्यूरल नेट है जो वाक् पहचान में मानव-स्तर की मजबूती और सटीकता तक पहुंचता है। यदि सक्षम किया गया है, तो आप ध्वनि पहचान में अतिरिक्त सटीकता का आनंद लेंगे जो TOM GPT को भेजता है, लेकिन अतिरिक्त लागत पर।

टीटीएस (टेक्स्ट-टू-स्पीच) एक ओपनएआई प्रणाली है जो टेक्स्ट को जीवंत बोले गए ऑडियो में बदल देती है। इसमें अतिरिक्त लागत भी आती है.

बेहतर उपयोगकर्ता अनुभव के लिए दोनों विकल्प डिफ़ॉल्ट रूप से सक्षम हैं। लेकिन धीमे नेटवर्क के मामले में त्वरित प्रतिक्रिया प्राप्त करने या अपनी लागत कम करने के लिए दोनों को अक्षम किया जा सकता है। हालाँकि, दोनों के सक्षम होने पर, अनुभव वास्तव में अद्भुत है।
और पढ़ें

विज्ञापन