OpenAI API Client - TOM APP
ChatGPT 的 OpenAI API 现已公开,通过 TOM,您可以在移动设备上释放 GPT-4 Turbo 和 GPT-4 Vision 的强大功能。
直接与 GPT 4 交谈、发起讨论或拍照并提出相关问题。你可以用任何语言说话,TOM 都能听懂。
通过点击系统提示来更改 TOM 的行为方式。让它扮演任何你想要的角色。
通过 OpenAI 的 Whisper 享受最准确的语音识别,通过 OpenAI 的 TTS 享受完美的人类语音。或者,将它们禁用并使用 Google 的服务,以降低延迟和成本,并提供更快的用户体验。
您还可以使用 GPT 3.5 Turbo 来加快响应速度并最大限度地降低成本。
TOM 是免费的,并且将永远是。但要使用 AI,您需要 AI 所有者 OpenAI 提供的 API 密钥。
GPT API 客户端
您无需按月订阅即可享受 GPT 4 Turbo 或 GPT 4 Vision:只需一个 API 密钥。好消息是 OpenAI 网站上的 API 密钥是免费的。以下是如何开始:
1. 在 https://platform.openai.com/api-keys 上创建您的 API 密钥
2. 使用 TOM 中的 API 密钥释放 THE BEAST
如果您随时需要更新或更改正在使用的 API 密钥,请点击“密钥”按钮。
控件
使用顶部的选择器在 GPT-3.5 Turbo 和 GPT-4 Turbo 之间切换,以管理您的成本或获得更快的响应。每当您拍照时,都会自动选择 GPT-4 Vision。
点击汤姆的描述来设置您自己的系统提示。它将指导 GPT 如何与您互动。
点击 SPEAK 按钮与 GPT 对话。
点击“相机”按钮拍照并询问任何相关信息。
之后您可以点击“发言”继续讨论该照片。
然而,你的上下文将会增长。
上下文是什么?
上下文包括您当前对话中所说的所有内容,包括拍摄的照片。每次都会将其发送到 API,因为 GPT 就是这样记住它的。
它随着每一个新句子,尤其是每张新图片而增长。发送到 API 的上下文越大,响应时间越长。重要的是,OpenAI 根据您的环境规模进行收费。
为了找到正确的平衡,TOM 提供了在上下文变得特别繁重时清除上下文的能力,尽管 GPT 会忘记之前的所有交互。为此,请使用 BIN 按钮。
图像尺寸
TOM 为发送到 GPT 的图片提供了三种设置:快速、中等和质量。
“快速”是默认值,提供较小的图像以更快地与 GPT 交互。它适用于文本和大多数类型的图像。
“中”提供更多细节,但会产生稍大的图像。
使用“质量”以获得最准确的结果。这些图像是 OpenAI API 中最重且成本最高的。
耳语和 TTS
Whisper 是一个 OpenAI 神经网络,其语音识别的鲁棒性和准确性接近人类水平。如果启用,您将享受 TOM 发送到 GPT 的语音识别的更高准确性,但需要支付额外费用。
TTS(文本转语音)是一个 OpenAI 系统,可将文本转换为逼真的语音。它还会产生额外费用。
默认情况下启用这两个选项以获得更好的用户体验。但可以禁用这两种功能,以便在网络速度较慢的情况下获得更快的响应,或者降低您的成本。然而,同时启用这两个功能,体验确实很棒。