OpenAI API Client - TOM APP
ChatGPT용 OpenAI API가 이제 공개되었으며, TOM을 사용하면 모바일 장치에서 GPT-4 Turbo 및 GPT-4 Vision의 성능을 발휘할 수 있습니다.
GPT 4와 직접 대화하고 토론을 시작하거나 사진을 찍고 질문하세요. 어떤 언어로든 말할 수 있으며 TOM은 모든 언어를 이해합니다.
시스템 프롬프트를 탭하여 TOM의 작동 방식을 변경하세요. 원하는 역할을 하게 만들어보세요.
OpenAI의 Whisper로 가장 정확한 음성 인식을 즐기고, OpenAI의 TTS로 완벽한 인간 음성을 즐겨보세요. 또는 지연 시간과 비용을 줄이고 더 빠른 사용자 환경을 위해 비활성화된 상태로 유지하고 Google 서비스를 사용하세요.
더 빠른 응답과 비용 최소화를 위해 GPT 3.5 Turbo를 사용할 수도 있습니다.
TOM은 무료이며 항상 그럴 것입니다. 하지만 AI를 활용하려면 AI 소유자인 OpenAI의 API 키가 필요합니다.
GPT API 클라이언트
GPT 4 Turbo 또는 GPT 4 Vision을 즐기기 위해 월간 구독이 필요하지 않습니다. API 키만 있으면 됩니다. 좋은 소식은 OpenAI 사이트에서 API 키가 무료라는 것입니다. 시작하는 방법은 다음과 같습니다.
1. https://platform.openai.com/api-keys에서 API 키를 생성하세요.
2. TOM에서 API 키를 사용하여 THE BEAST를 활용하세요
사용 중인 API 키를 업데이트하거나 변경해야 하는 경우 언제든지 키 버튼을 탭하세요.
컨트롤
상단의 선택기를 사용하여 GPT-3.5 Turbo와 GPT-4 Turbo 사이를 전환하면 비용을 관리하거나 더 빠른 응답을 받을 수 있습니다. 사진을 찍을 때마다 GPT-4 Vision이 자동으로 선택됩니다.
Tom의 설명을 탭하여 자신만의 시스템 프롬프트를 설정하세요. GPT가 귀하와 상호작용하는 방법을 안내합니다.
말하기 버튼을 탭하여 GPT와 대화하세요.
CAMERA 버튼을 눌러 사진을 찍고 무엇이든 물어보세요.
나중에 '말하기'를 탭하여 해당 사진에 대해 계속 토론할 수 있습니다.
그러나 CONTEXT는 커질 것입니다.
맥락은 무엇입니까?
맥락에는 촬영한 사진을 포함하여 현재 대화에서 말한 모든 내용이 포함됩니다. GPT가 이를 기억하는 방식이므로 매번 API로 전송됩니다.
새로운 문장이 나올 때마다, 특히 새로운 그림이 나올 때마다 성장합니다. API로 전송되는 컨텍스트가 클수록 응답 시간이 길어집니다. 그리고 중요한 것은 OpenAI가 컨텍스트의 크기에 따라 비용을 청구한다는 것입니다.
적절한 균형을 찾기 위해 TOM은 컨텍스트가 특히 무거워질 때마다 컨텍스트를 지우는 기능을 제공합니다. 단, 그러면 GPT는 이전의 모든 상호 작용을 잊어버립니다. 이를 위해 BIN 버튼을 사용하십시오.
이미지 크기
TOM은 GPT로 전송되는 사진에 대해 고속, 중간, 품질의 세 가지 설정을 제공합니다.
'빠름'이 기본값이며, GPT와의 더 빠른 상호작용을 위해 더 작은 이미지를 제공합니다. 텍스트와 대부분의 이미지 유형에 잘 작동합니다.
'중간'은 더 자세한 내용을 제공하지만 이미지가 약간 더 커집니다.
정확도를 높이려면 '품질'을 사용하세요. 이러한 이미지는 OpenAI API에서 가장 무겁고 비용이 많이 듭니다.
귓속말 및 TTS
Whisper는 음성 인식 분야에서 인간 수준의 견고성과 정확성에 접근하는 OpenAI 신경망입니다. 활성화하면 TOM이 GPT로 전송하는 음성 인식의 정확성이 더욱 향상되지만 추가 비용이 발생합니다.
TTS(Text-to-Speech)는 텍스트를 실제 음성 오디오로 변환하는 OpenAI 시스템입니다. 추가 비용도 발생합니다.
더 나은 사용자 경험을 위해 두 옵션 모두 기본적으로 활성화되어 있습니다. 그러나 네트워크 속도가 느린 경우 더 빠른 응답을 얻거나 비용을 줄이기 위해 둘 다 비활성화할 수 있습니다. 그러나 두 가지를 모두 활성화하면 경험은 정말 굉장합니다.