Klien API untuk memanfaatkan fitur visi & ucapan OpenAI

Versi Terbaru

Versi
Memperbarui
19 Des 2023
Developer
Kategori
Google Play ID
Instal
100+

App APKs

OpenAI API Client - TOM APP

TOM, klien terlengkap untuk API ChatGPT

OpenAI API untuk ChatGPT kini bersifat publik, dan dengan TOM, Anda dapat memanfaatkan kecanggihan GPT-4 Turbo dan GPT-4 Vision di perangkat seluler Anda.

Bicara langsung dengan GPT 4, mulai diskusi, atau ambil foto dan ajukan pertanyaan tentangnya. Anda dapat berbicara dalam bahasa apa pun, TOM memahami semuanya.

Ubah cara TOM berperilaku dengan mengetuk perintah sistem. Jadikan itu memainkan peran apa pun yang Anda inginkan.

Nikmati pengenalan suara paling akurat dengan Whisper OpenAI, dan ucapan manusia sempurna dengan TTS OpenAI. Alternatifnya, tetap nonaktifkan fitur tersebut dan gunakan layanan Google untuk mendapatkan latensi dan biaya yang lebih rendah, serta pengalaman pengguna yang lebih cepat.

Anda juga dapat menggunakan GPT 3.5 Turbo untuk respons yang lebih cepat dan meminimalkan biaya.

TOM gratis dan akan selalu. Namun untuk menggunakan AI, Anda memerlukan kunci API dari pemilik AI, OpenAI.

Klien API GPT
Anda tidak perlu berlangganan bulanan untuk menikmati GPT 4 Turbo atau GPT 4 Vision: cukup kunci API. Dan kabar baiknya adalah kunci API gratis di situs OpenAI. Berikut cara memulainya:

1. Buat kunci API Anda di https://platform.openai.com/api-keys
2. Gunakan kunci API Anda di TOM untuk melepaskan THE BEAST

Jika suatu saat Anda perlu memperbarui atau mengubah kunci API yang Anda gunakan, ketuk tombol KEY.

Kontrol

Gunakan pemilih di atas untuk beralih antara GPT-3.5 Turbo dan GPT-4 Turbo guna mengelola biaya atau untuk respons yang lebih cepat. GPT-4 Vision dipilih secara otomatis setiap kali Anda mengambil foto.

Ketuk deskripsi Tom untuk mengatur perintah sistem Anda sendiri. Ini akan memandu GPT tentang cara berinteraksi dengan Anda.

Ketuk tombol BERBICARA untuk berbicara dengan GPT.
Ketuk tombol KAMERA untuk mengambil gambar dan menanyakan apa pun tentangnya.
Anda dapat terus mendiskusikan foto tersebut dengan mengetuk 'BERBICARA' setelahnya.
Namun, KONTEKS Anda akan berkembang.

Apa konteksnya?

Konteksnya mencakup semua yang dikatakan dalam percakapan Anda saat ini, termasuk gambar yang diambil. Itu dikirim ke API setiap kali, karena itulah cara GPT mengingatnya.

Itu tumbuh dengan setiap kalimat baru dan terutama dengan setiap gambar baru. Semakin besar konteks yang dikirimkan ke API, semakin lama waktu responsnya. Dan yang terpenting, OpenAI mengenakan biaya berdasarkan ukuran konteks Anda.

Untuk menemukan keseimbangan yang tepat, TOM memberikan kemampuan untuk menghapus konteks setiap kali menjadi sangat berat, meskipun GPT akan melupakan semua interaksi sebelumnya. Gunakan tombol BIN untuk tujuan ini.

Ukuran gambar

TOM menawarkan tiga pengaturan untuk gambar yang dikirim ke GPT: cepat, sedang, dan kualitas.

'Fast' adalah defaultnya, menyediakan gambar lebih kecil untuk interaksi lebih cepat dengan GPT. Ini berfungsi baik dengan teks dan sebagian besar jenis gambar.

'Medium' menawarkan lebih banyak detail namun menghasilkan gambar yang sedikit lebih besar.

Gunakan 'kualitas' untuk akurasi tertinggi. Gambar-gambar ini adalah yang terberat dan paling mahal di OpenAI API.

Bisikan dan TTS
Whisper adalah jaringan saraf OpenAI yang mendekati ketahanan dan akurasi tingkat manusia dalam pengenalan ucapan. Jika diaktifkan, Anda akan menikmati akurasi ekstra dalam pengenalan suara yang dikirimkan TOM ke GPT, namun dengan biaya tambahan.

TTS (Text-to-Speech) adalah sistem OpenAI yang mengubah teks menjadi audio lisan yang nyata. Hal ini juga menimbulkan biaya tambahan.

Kedua opsi diaktifkan secara default untuk pengalaman pengguna yang lebih baik. Namun keduanya dapat dinonaktifkan untuk mendapatkan respons yang lebih cepat jika jaringan lambat, atau untuk mengurangi biaya. Namun, dengan keduanya diaktifkan, pengalamannya sungguh luar biasa.
Baca selengkapnya

Iklan