ไคลเอนต์ API เพื่อควบคุมคุณสมบัติการมองเห็นและคำพูดของ OpenAI

รุ่นล่าสุด

เวอร์ชัน
ปรับปรุง
19 ธ.ค. 2566
นักพัฒนาซอฟต์แวร์
ประเภท
Google Play ID
การติดตั้ง
100+

App APKs

OpenAI API Client - TOM APP

TOM ไคลเอนต์ที่สมบูรณ์แบบที่สุดสำหรับ API ของ ChatGPT

OpenAI API สำหรับ ChatGPT เปิดให้สาธารณะแล้ว และด้วย TOM คุณสามารถปลดปล่อยพลังของ GPT-4 Turbo และ GPT-4 Vision บนอุปกรณ์เคลื่อนที่ของคุณได้

พูดคุยกับ GPT 4 โดยตรง เริ่มการสนทนา หรือถ่ายรูปและถามคำถามเกี่ยวกับพวกเขา คุณสามารถพูดภาษาใดก็ได้ TOM เข้าใจพวกเขาทั้งหมด

เปลี่ยนวิธีการทำงานของ TOM โดยแตะที่ข้อความแจ้งของระบบ ทำให้มันมีบทบาทตามที่คุณต้องการ

เพลิดเพลินกับการจดจำเสียงที่แม่นยำที่สุดด้วย Whisper ของ OpenAI และคำพูดของมนุษย์อย่างสมบูรณ์แบบด้วย TTS ของ OpenAI หรืออีกวิธีหนึ่ง ให้ปิดใช้งานและใช้บริการของ Google เพื่อลดเวลาแฝงและต้นทุน และประสบการณ์ผู้ใช้ที่รวดเร็วยิ่งขึ้น

คุณยังสามารถใช้ GPT 3.5 Turbo เพื่อการตอบสนองที่รวดเร็วยิ่งขึ้นและลดต้นทุนได้อีกด้วย

TOM เป็นอิสระและจะเป็นเช่นนั้นตลอดไป แต่หากต้องการใช้งาน AI คุณจะต้องมีคีย์ API จากเจ้าของ AI ซึ่งก็คือ OpenAI

ไคลเอ็นต์ GPT API
คุณไม่จำเป็นต้องสมัครสมาชิกรายเดือนเพื่อเพลิดเพลินกับ GPT 4 Turbo หรือ GPT 4 Vision: เพียงแค่คีย์ API และข่าวดีก็คือคีย์ API นั้นฟรีบนเว็บไซต์ของ OpenAI ต่อไปนี้เป็นวิธีเริ่มต้น:

1. สร้างคีย์ API ของคุณบน https://platform.openai.com/api-keys
2. ใช้คีย์ API ของคุณใน TOM เพื่อปลดปล่อย THE BEAST

หากคุณต้องการอัปเดตหรือเปลี่ยนแปลงคีย์ API ที่คุณใช้อยู่เมื่อใดก็ตาม ให้แตะที่ปุ่มคีย์

การควบคุม

ใช้ตัวเลือกด้านบนเพื่อสลับระหว่าง GPT-3.5 Turbo และ GPT-4 Turbo เพื่อจัดการต้นทุนหรือเพื่อการตอบสนองที่รวดเร็วยิ่งขึ้น GPT-4 Vision จะถูกเลือกโดยอัตโนมัติทุกครั้งที่คุณถ่ายภาพ

แตะที่คำอธิบายของ Tom เพื่อตั้งค่าพรอมต์ระบบของคุณเอง มันจะแนะนำ GPT เกี่ยวกับวิธีการโต้ตอบกับคุณ

แตะที่ปุ่มพูดเพื่อพูดคุยกับ GPT
แตะที่ปุ่ม CAMERA เพื่อถ่ายรูปและถามอะไรก็ได้
คุณสามารถพูดคุยเรื่องรูปภาพนั้นต่อได้โดยการแตะ "พูด" หลังจากนั้น
อย่างไรก็ตาม CONTEXT ของคุณจะเติบโตขึ้น

บริบทคืออะไร

บริบทประกอบด้วยทุกสิ่งที่พูดในการสนทนาปัจจุบันของคุณ รวมถึงรูปภาพที่ถ่ายด้วย โดยจะส่งไปยัง API ทุกครั้ง เนื่องจาก GPT จดจำสิ่งนี้ไว้

มันเติบโตไปพร้อมกับทุกประโยคใหม่และโดยเฉพาะอย่างยิ่งกับรูปภาพใหม่แต่ละภาพ ยิ่งบริบทส่งไปยัง API มากเท่าใด เวลาตอบสนองก็จะนานขึ้นเท่านั้น และที่สำคัญ OpenAI จะเรียกเก็บเงินตามขนาดของบริบทของคุณ

เพื่อค้นหาสมดุลที่เหมาะสม TOM มอบความสามารถในการล้างบริบทเมื่อใดก็ตามที่บริบทนั้นหนักหนาเป็นพิเศษ แม้ว่า GPT จะลืมการโต้ตอบก่อนหน้านี้ทั้งหมดก็ตาม ใช้ปุ่ม BIN เพื่อจุดประสงค์นี้

ขนาดภาพ

TOM มีการตั้งค่าสามแบบสำหรับรูปภาพที่ส่งไปยัง GPT: รวดเร็ว ปานกลาง และคุณภาพ

"เร็ว" เป็นค่าเริ่มต้น โดยให้รูปภาพมีขนาดเล็กลงเพื่อการโต้ตอบกับ GPT ที่รวดเร็วยิ่งขึ้น ใช้งานได้ดีกับข้อความและรูปภาพเกือบทุกประเภท

"ปานกลาง" ให้รายละเอียดมากกว่าแต่จะได้ภาพที่ใหญ่ขึ้นเล็กน้อย

ใช้ 'คุณภาพ' เพื่อความถูกต้องสูงสุด รูปภาพเหล่านี้มีน้ำหนักมากที่สุดและมีค่าใช้จ่ายมากที่สุดใน OpenAI API

กระซิบและ TTS
Whisper คือโครงข่ายประสาทเทียม OpenAI ที่เข้าใกล้ความแข็งแกร่งและความแม่นยำระดับมนุษย์ในการรู้จำเสียง หากเปิดใช้งาน คุณจะเพลิดเพลินไปกับความแม่นยำพิเศษในการจดจำเสียงที่ TOM ส่งไปยัง GPT แต่มีค่าใช้จ่ายเพิ่มเติม

TTS (Text-to-Speech) เป็นระบบ OpenAI ที่เปลี่ยนข้อความให้เป็นเสียงพูดที่เหมือนจริง นอกจากนี้ยังมีค่าใช้จ่ายเพิ่มเติม

ตัวเลือกทั้งสองจะเปิดใช้งานตามค่าเริ่มต้นเพื่อประสบการณ์ผู้ใช้ที่ดีขึ้น แต่สามารถปิดการใช้งานทั้งสองอย่างได้เพื่อรับการตอบสนองที่รวดเร็วยิ่งขึ้นในกรณีที่เครือข่ายช้าหรือเพื่อลดต้นทุนของคุณ อย่างไรก็ตาม เมื่อเปิดใช้งานทั้งคู่ ประสบการณ์ก็ยอดเยี่ยมมาก
อ่านเพิ่มเติม

โฆษณา