OpenAI API Client - TOM APP
OpenAI API สำหรับ ChatGPT เปิดให้สาธารณะแล้ว และด้วย TOM คุณสามารถปลดปล่อยพลังของ GPT-4 Turbo และ GPT-4 Vision บนอุปกรณ์เคลื่อนที่ของคุณได้
พูดคุยกับ GPT 4 โดยตรง เริ่มการสนทนา หรือถ่ายรูปและถามคำถามเกี่ยวกับพวกเขา คุณสามารถพูดภาษาใดก็ได้ TOM เข้าใจพวกเขาทั้งหมด
เปลี่ยนวิธีการทำงานของ TOM โดยแตะที่ข้อความแจ้งของระบบ ทำให้มันมีบทบาทตามที่คุณต้องการ
เพลิดเพลินกับการจดจำเสียงที่แม่นยำที่สุดด้วย Whisper ของ OpenAI และคำพูดของมนุษย์อย่างสมบูรณ์แบบด้วย TTS ของ OpenAI หรืออีกวิธีหนึ่ง ให้ปิดใช้งานและใช้บริการของ Google เพื่อลดเวลาแฝงและต้นทุน และประสบการณ์ผู้ใช้ที่รวดเร็วยิ่งขึ้น
คุณยังสามารถใช้ GPT 3.5 Turbo เพื่อการตอบสนองที่รวดเร็วยิ่งขึ้นและลดต้นทุนได้อีกด้วย
TOM เป็นอิสระและจะเป็นเช่นนั้นตลอดไป แต่หากต้องการใช้งาน AI คุณจะต้องมีคีย์ API จากเจ้าของ AI ซึ่งก็คือ OpenAI
ไคลเอ็นต์ GPT API
คุณไม่จำเป็นต้องสมัครสมาชิกรายเดือนเพื่อเพลิดเพลินกับ GPT 4 Turbo หรือ GPT 4 Vision: เพียงแค่คีย์ API และข่าวดีก็คือคีย์ API นั้นฟรีบนเว็บไซต์ของ OpenAI ต่อไปนี้เป็นวิธีเริ่มต้น:
1. สร้างคีย์ API ของคุณบน https://platform.openai.com/api-keys
2. ใช้คีย์ API ของคุณใน TOM เพื่อปลดปล่อย THE BEAST
หากคุณต้องการอัปเดตหรือเปลี่ยนแปลงคีย์ API ที่คุณใช้อยู่เมื่อใดก็ตาม ให้แตะที่ปุ่มคีย์
การควบคุม
ใช้ตัวเลือกด้านบนเพื่อสลับระหว่าง GPT-3.5 Turbo และ GPT-4 Turbo เพื่อจัดการต้นทุนหรือเพื่อการตอบสนองที่รวดเร็วยิ่งขึ้น GPT-4 Vision จะถูกเลือกโดยอัตโนมัติทุกครั้งที่คุณถ่ายภาพ
แตะที่คำอธิบายของ Tom เพื่อตั้งค่าพรอมต์ระบบของคุณเอง มันจะแนะนำ GPT เกี่ยวกับวิธีการโต้ตอบกับคุณ
แตะที่ปุ่มพูดเพื่อพูดคุยกับ GPT
แตะที่ปุ่ม CAMERA เพื่อถ่ายรูปและถามอะไรก็ได้
คุณสามารถพูดคุยเรื่องรูปภาพนั้นต่อได้โดยการแตะ "พูด" หลังจากนั้น
อย่างไรก็ตาม CONTEXT ของคุณจะเติบโตขึ้น
บริบทคืออะไร
บริบทประกอบด้วยทุกสิ่งที่พูดในการสนทนาปัจจุบันของคุณ รวมถึงรูปภาพที่ถ่ายด้วย โดยจะส่งไปยัง API ทุกครั้ง เนื่องจาก GPT จดจำสิ่งนี้ไว้
มันเติบโตไปพร้อมกับทุกประโยคใหม่และโดยเฉพาะอย่างยิ่งกับรูปภาพใหม่แต่ละภาพ ยิ่งบริบทส่งไปยัง API มากเท่าใด เวลาตอบสนองก็จะนานขึ้นเท่านั้น และที่สำคัญ OpenAI จะเรียกเก็บเงินตามขนาดของบริบทของคุณ
เพื่อค้นหาสมดุลที่เหมาะสม TOM มอบความสามารถในการล้างบริบทเมื่อใดก็ตามที่บริบทนั้นหนักหนาเป็นพิเศษ แม้ว่า GPT จะลืมการโต้ตอบก่อนหน้านี้ทั้งหมดก็ตาม ใช้ปุ่ม BIN เพื่อจุดประสงค์นี้
ขนาดภาพ
TOM มีการตั้งค่าสามแบบสำหรับรูปภาพที่ส่งไปยัง GPT: รวดเร็ว ปานกลาง และคุณภาพ
"เร็ว" เป็นค่าเริ่มต้น โดยให้รูปภาพมีขนาดเล็กลงเพื่อการโต้ตอบกับ GPT ที่รวดเร็วยิ่งขึ้น ใช้งานได้ดีกับข้อความและรูปภาพเกือบทุกประเภท
"ปานกลาง" ให้รายละเอียดมากกว่าแต่จะได้ภาพที่ใหญ่ขึ้นเล็กน้อย
ใช้ 'คุณภาพ' เพื่อความถูกต้องสูงสุด รูปภาพเหล่านี้มีน้ำหนักมากที่สุดและมีค่าใช้จ่ายมากที่สุดใน OpenAI API
กระซิบและ TTS
Whisper คือโครงข่ายประสาทเทียม OpenAI ที่เข้าใกล้ความแข็งแกร่งและความแม่นยำระดับมนุษย์ในการรู้จำเสียง หากเปิดใช้งาน คุณจะเพลิดเพลินไปกับความแม่นยำพิเศษในการจดจำเสียงที่ TOM ส่งไปยัง GPT แต่มีค่าใช้จ่ายเพิ่มเติม
TTS (Text-to-Speech) เป็นระบบ OpenAI ที่เปลี่ยนข้อความให้เป็นเสียงพูดที่เหมือนจริง นอกจากนี้ยังมีค่าใช้จ่ายเพิ่มเติม
ตัวเลือกทั้งสองจะเปิดใช้งานตามค่าเริ่มต้นเพื่อประสบการณ์ผู้ใช้ที่ดีขึ้น แต่สามารถปิดการใช้งานทั้งสองอย่างได้เพื่อรับการตอบสนองที่รวดเร็วยิ่งขึ้นในกรณีที่เครือข่ายช้าหรือเพื่อลดต้นทุนของคุณ อย่างไรก็ตาม เมื่อเปิดใช้งานทั้งคู่ ประสบการณ์ก็ยอดเยี่ยมมาก