OpenAI API Client - TOM APP
L'API OpenAI per ChatGPT è ora pubblica e con TOM puoi liberare la potenza di GPT-4 Turbo e GPT-4 Vision sul tuo dispositivo mobile.
Parla direttamente con GPT 4, avvia una discussione o scatta foto e fai domande al riguardo. Puoi parlare in qualsiasi lingua, TOM le capisce tutte.
Cambia il comportamento di TOM toccando il prompt del sistema. Fallo interpretare il ruolo che desideri.
Goditi il riconoscimento vocale più accurato con Whisper di OpenAI e un parlato perfettamente umano con TTS di OpenAI. In alternativa, mantienili disabilitati e utilizza i servizi di Google per ridurre latenza e costi e un'esperienza utente più rapida.
Puoi anche utilizzare GPT 3.5 Turbo per risposte più rapide e per ridurre al minimo i costi.
TOM è gratuito e lo sarà sempre. Ma per utilizzare l'intelligenza artificiale avrai bisogno di una chiave API dal proprietario dell'intelligenza artificiale, OpenAI.
Un client API GPT
Non hai bisogno di un abbonamento mensile per usufruire di GPT 4 Turbo o GPT 4 Vision: basta una chiave API. E la buona notizia è che le chiavi API sono gratuite sul sito di OpenAI. Ecco come iniziare:
1. Crea la tua chiave API su https://platform.openai.com/api-keys
2. Usa la tua chiave API in TOM per scatenare THE BEAST
Se in qualsiasi momento hai bisogno di aggiornare o modificare la chiave API che stai utilizzando, tocca il pulsante CHIAVE.
Controlli
Utilizza il selettore in alto per passare da GPT-3.5 Turbo a GPT-4 Turbo per gestire i costi o per una risposta più rapida. GPT-4 Vision viene selezionato automaticamente ogni volta che scatti una fotografia.
Tocca la descrizione di Tom per impostare il tuo messaggio di sistema. Guiderà GPT su come interagire con te.
Tocca il pulsante PARLA per parlare con GPT.
Tocca il pulsante FOTOCAMERA per scattare una foto e chiedere qualsiasi cosa al riguardo.
Puoi continuare a discutere quella foto toccando "PARLA" in seguito.
Tuttavia, il tuo CONTESTO crescerà.
Qual è il contesto?
Il contesto include tutto ciò che è stato detto nella conversazione attuale, comprese le foto scattate. Viene inviato ogni volta all'API, poiché è così che GPT lo ricorda.
Cresce con ogni nuova frase e soprattutto con ogni nuova immagine. Maggiore è il contesto inviato all'API, maggiore sarà il tempo di risposta. E, cosa più importante, OpenAI addebita i costi in base alle dimensioni del contesto.
Per trovare il giusto equilibrio, TOM prevede la possibilità di chiarire il contesto ogni volta che diventa particolarmente pesante, anche se GPT poi dimenticherà tutte le interazioni precedenti. Utilizzare il pulsante BIN a questo scopo.
Dimensioni immagine
TOM offre tre impostazioni per le immagini inviate a GPT: veloce, media e qualità.
L'impostazione predefinita è "Veloce" e fornisce immagini più piccole per un'interazione più rapida con GPT. Funziona bene con i testi e la maggior parte dei tipi di immagini.
'Medio' offre più dettagli ma produce immagini leggermente più grandi.
Utilizza "qualità" per la massima precisione. Queste immagini sono le più pesanti e costose nell'API OpenAI.
Sussurro e TTS
Whisper è una rete neurale OpenAI che si avvicina alla robustezza e all'accuratezza a livello umano nel riconoscimento vocale. Se abilitato, potrai usufruire di una maggiore precisione nel riconoscimento vocale che TOM invia a GPT, ma a un costo aggiuntivo.
TTS (Text-to-Speech) è un sistema OpenAI che trasforma il testo in audio parlato realistico. Inoltre comporta costi aggiuntivi.
Entrambe le opzioni sono abilitate per impostazione predefinita per una migliore esperienza utente. Ma entrambi possono essere disabilitati per ottenere risposte più rapide in caso di reti lente o per ridurre i costi. Tuttavia, con entrambi abilitati, l'esperienza è davvero fantastica.