ഡിജിയോ ഇൻഫ്രാസ്ട്രക്ചർ

AI മോഡലുകളും GPU

നിയന്ത്രിത അതിർത്തി മോഡലുകളിൽ ഇന്ന് ഏജൻ്റുമാരെ പ്രവർത്തിപ്പിക്കുക-അല്ലെങ്കിൽ GPU കപ്പാസിറ്റി വാടകയ്‌ക്കെടുക്കുക, നിങ്ങളുടെ സ്വന്തം ഭാരം വിന്യസിക്കുക, ഡിജിയോ ടാസ്‌ക്കുകൾ അതേ വർക്ക്‌സ്‌പെയ്‌സിലെ സ്വകാര്യ എൻഡ്‌പോയിൻ്റുകളിലേക്ക് നയിക്കുക.

ക്ലോഡ്, ജിപിടി, ജെമിനി ഓരോ ഏജൻ്റ് മോഡൽ തിരഞ്ഞെടുക്കൽ GPU വാടകയ്‌ക്കെടുക്കലും BYOM
നിയന്ത്രിത മോഡലുകൾ

ഇന്ന് ഡിജിയോയിൽ മോഡലുകൾ ലഭ്യമാണ്

ഒരു ഏജൻ്റിന് ഒരു ഡിഫോൾട്ട് മോഡൽ നൽകുക അല്ലെങ്കിൽ ഓരോ ടാസ്‌ക്കും അസാധുവാക്കുക. നിങ്ങളുടെ പ്ലാൻ ബാലൻസിൽ നിന്ന് ഡിജിയോ ടോക്കണുകളിൽ ഉപയോഗം കണക്കാക്കുന്നു-ഏജൻറ് സോണറ്റ്, GPT-4o, അല്ലെങ്കിൽ Gemini Flash എന്നിവയെ വിളിച്ചാലും അതേ വാലറ്റ്.

ആന്ത്രോപിക് ക്ലോഡ്

  • Claude Opus 4.7 മുൻനിര ന്യായവാദം, നീണ്ട സന്ദർഭം, വാസ്തുവിദ്യ, തന്ത്രപരമായ പ്രവർത്തനങ്ങൾ.
  • Claude Opus 4.6 സുസ്ഥിരവും ഉയർന്ന നിലവാരമുള്ളതുമായ വിശകലനത്തിനുള്ള മുൻ തലമുറ ഓപസ്.
  • Claude Sonnet 4.6 പ്രതിദിന ഡ്രൈവർ-കോഡിംഗ്, എഴുത്ത്, മൾട്ടി-സ്റ്റെപ്പ് ഏജൻ്റ് ലൂപ്പുകൾ.
  • Claude Sonnet 4.5 / 4 പിന്തുണയ്‌ക്കുന്ന വർക്ക്‌ലോഡുകളിൽ പ്രോംപ്‌റ്റ് കാഷിംഗ് ഉള്ള ഫാസ്റ്റ് സോണറ്റ് ടയറുകൾ.
  • Claude Haiku 4.5 ലോ-ലേറ്റൻസി ഡ്രാഫ്റ്റുകൾ, വർഗ്ഗീകരണം, ഉയർന്ന വോളിയം സബ്ടാസ്ക്കുകൾ.

ഓപ്പൺഎഐ

  • GPT-5.5 / GPT-5.4 / GPT-5.2 പൊതുവായതും ഏജൻ്റുമാരുമായ ജോലിഭാരങ്ങൾക്കായുള്ള ഏറ്റവും പുതിയ GPT-5 കുടുംബം.
  • GPT-4.1 & GPT-4o പ്രൊഡക്ഷൻ ഏജൻ്റുമാർക്കുള്ള വിശ്വസനീയമായ മൾട്ടിമോഡൽ ചാറ്റും ടൂൾ ഉപയോഗവും.
  • GPT-4o mini സംഗ്രഹങ്ങൾക്കും ഭാരം കുറഞ്ഞ ഘട്ടങ്ങൾക്കുമായി ചെലവ് കുറഞ്ഞ റൂട്ടിംഗ്.
  • o3 / o3-pro / o3-mini / o4-mini കണക്ക്, ആസൂത്രണം, സ്ഥിരീകരണം എന്നിവയ്‌ക്കായുള്ള യുക്തി-കേന്ദ്രീകൃത മോഡലുകൾ.
  • GPT-5.3 Codex & Codex mini കോഡ് ജനറേഷൻ, റിഫാക്‌ടറുകൾ, റിപ്പോ-അവെയർ ഏജൻ്റ് കഴിവുകൾ.

ഗൂഗിൾ ജെമിനി

  • Gemini 2.5 Pro ദൈർഘ്യമേറിയ സന്ദർഭ ഗവേഷണവും ഘടനാപരമായ വേർതിരിച്ചെടുക്കലും.
  • Gemini 2.5 Flash മത്സരാധിഷ്ഠിത ടോക്കൺ നിരക്കുകൾക്കൊപ്പം ഉയർന്ന ത്രൂപുട്ട് ഏജൻ്റ് ചുവടുകൾ.
  • Gemini 2.0 Flash പാഴ്‌സിംഗ്, ടാഗിംഗ്, ബാച്ച് ജോലികൾ എന്നിവയ്ക്കുള്ള അൾട്രാ ഫാസ്റ്റ് പാസുകൾ.

ഓപ്പൺ & സ്പെഷ്യലിസ്റ്റ് API-കൾ

  • DeepSeek Chat & Reasoner ചാറ്റിനും ചിന്താ ശൈലിയിലുള്ള ജോലികൾക്കും ശക്തമായ മൂല്യം.
  • Mistral Large ബഹുഭാഷാ ഏജൻ്റ് ടീമുകൾക്കുള്ള യൂറോപ്യൻ ഹോസ്റ്റ് ഓപ്ഷൻ.
  • Llama 3.3 70B API വഴിയുള്ള ഓപ്പൺ-വെയ്റ്റ് ക്ലാസ് മോഡൽ-സ്വകാര്യ ജിപിയുവുമായി നന്നായി ജോടിയാക്കുന്നു.
  • Grok 3 വാർത്തകൾക്കും സാമൂഹിക നിരീക്ഷണ ഏജൻ്റുമാർക്കും തത്സമയ അധിഷ്ഠിത മോഡൽ.
  • Sonar Pro ഗവേഷണ ഏജൻ്റുമാർക്കുള്ള തിരയൽ അടിസ്ഥാനത്തിലുള്ള ഉത്തരങ്ങൾ.
  • Command R+ RAG-സൗഹൃദ എൻ്റർപ്രൈസ് ചാറ്റും വീണ്ടെടുക്കൽ വർക്ക്ഫ്ലോകളും.

Model list and token economics evolve with provider releases. Your workspace shows live options when you assign a model to an agent; Digio Tokens debit from the same balance as in pricing.

ഉപയോഗം

ഏജൻ്റുമാർ എങ്ങനെ ഒരു മോഡൽ തിരഞ്ഞെടുക്കുന്നു

ടാസ്‌ക് തരത്തെ അടിസ്ഥാനമാക്കി സോണറ്റ് വേഴ്സസ് ഓപസ് വേഴ്സസ് വിലകുറഞ്ഞ ഫ്ലാഷ് മോഡൽ കോർഡിനേറ്റർക്ക് ശുപാർശ ചെയ്യാൻ കഴിയും. പവർ ഉപയോക്താക്കൾ ഒരു ഏജൻ്റ് റോളിന് ഡിഫോൾട്ടുകൾ സജ്ജീകരിക്കുന്നു-സോണറ്റിലെ ഗവേഷണം, ഓപസിലെ അന്തിമ അവലോകനം, ഹൈക്കു അല്ലെങ്കിൽ ജെമിനി ഫ്ലാഷിൽ ബൾക്ക് ടാഗിംഗ്.

  • Per agent — default model in agent settings; override in To do or chat when needed.

  • Metered fairly — input, output, and cached tokens map to Digio Token charges (see usage in your wallet).

  • Skills stay the same — tools and integrations work across models; only latency and cost profile change.

  • Plan limits — more agents and monthly Digio Tokens on higher tiers; top up anytime on the pricing page.

GPU വാടകയ്ക്ക്

ജിപിയു വാടകയ്ക്ക് എടുത്ത് നിങ്ങളുടെ സ്വന്തം മോഡലുകൾ പ്രവർത്തിപ്പിക്കുക

ഒരു ഫൈൻ ട്യൂൺ വേണോ, എയർ-ഗെയിപ്പ് ചെക്ക് പോയിൻ്റ്, അല്ലെങ്കിൽ പ്രവചിക്കാവുന്ന അനുമാന വില? നിങ്ങളുടെ ഡിജിയോ വർക്ക്‌സ്‌പെയ്‌സിലേക്ക് സമർപ്പിത ജിപിയു കപ്പാസിറ്റി ചേർക്കുക, നിങ്ങൾ ഇഷ്ടപ്പെടുന്ന സെർവിംഗ് സ്റ്റാക്ക് ഇൻസ്റ്റാൾ ചെയ്യുക, നിങ്ങളുടെ സ്വകാര്യ എൻഡ്‌പോയിൻ്റിൽ പോയിൻ്റ് ഏജൻ്റുകൾ എന്നിവ ചേർക്കുക.

സമർപ്പിത സന്ദർഭങ്ങൾ

നിങ്ങളുടെ വാടകക്കാരനുമായി ഘടിപ്പിച്ചിട്ടുള്ള മണിക്കൂർ അല്ലെങ്കിൽ പ്രതിമാസ GPU നോഡുകൾ (A100, H100, L40S ക്ലാസ്) മറ്റ് ഉപഭോക്താക്കളിൽ നിന്ന് വേർതിരിച്ചിരിക്കുന്നു.

നിങ്ങളുടെ ഭാരം

സേഫ്‌റ്റൻസറുകൾ, GGUF അപ്‌ലോഡ് ചെയ്യുക അല്ലെങ്കിൽ നിങ്ങളുടെ രജിസ്ട്രിയിൽ നിന്ന് പിൻവലിക്കുക; ലാമ, മിസ്ട്രൽ, ക്വെൻ, ഇഷ്‌ടാനുസൃത ഫൈൻ ട്യൂണുകൾ എന്നിവ പ്രവർത്തിപ്പിക്കുക.

സ്റ്റാൻഡേർഡ് സെർവിംഗ്

vLLM, TGI, Ollama അല്ലെങ്കിൽ നിങ്ങൾ പരിപാലിക്കുന്ന കണ്ടെയ്‌നർ ഇമേജുകൾ—Digio ഏജൻ്റുകൾ OpenAI-അനുയോജ്യമായ അടിസ്ഥാന URL-നെ വിളിക്കുന്നു.

ഒരേ ഓർക്കസ്ട്രേഷൻ

ചെയ്യാൻ, ടീം ചാറ്റ്, കഴിവുകൾ, സഹകരണം എന്നിവയിൽ മാറ്റമില്ല-അനുമാനത്തിൻ്റെ ബാക്കെൻഡ് മാത്രം നിങ്ങളുടേതാണ്.

ഹൈബ്രിഡ് റൂട്ടിംഗ്

സ്വകാര്യ ജിപിയുവിലേക്ക് സെൻസിറ്റീവ് ഘട്ടങ്ങൾ അയയ്‌ക്കുക, ഒരു വർക്ക്ഫ്ലോയിൽ പൊതു ഗവേഷണത്തിനായി ക്ലോഡ് അല്ലെങ്കിൽ ജിപിടി ഉപയോഗിക്കുക.

എൻ്റർപ്രൈസ് നിയന്ത്രണങ്ങൾ

VPC പിയറിംഗ്, സ്റ്റാറ്റിക് എഗ്രസ്, ഓഡിറ്റ് ലോഗുകൾ, നിയന്ത്രിത ടീമുകൾക്കുള്ള മോഡൽ അനുവദനീയ ലിസ്റ്റുകൾ.

നിങ്ങളുടെ സ്വന്തം മോഡൽ കൊണ്ടുവരിക

ഒരു ഇഷ്‌ടാനുസൃത മോഡൽ ഇൻസ്റ്റാൾ ചെയ്യുകയും ബന്ധിപ്പിക്കുകയും ചെയ്യുക

പൂജ്യത്തിൽ നിന്ന് നിങ്ങളുടെ എൻഡ്‌പോയിൻ്റിനെ വിളിക്കുന്ന ഏജൻ്റുമാരിലേക്കുള്ള സാധാരണ സജ്ജീകരണം:

  1. റിസർവ് ജിപിയു

    VRAM, പ്രദേശം, പ്രവർത്തന സമയം എന്നിവ തിരഞ്ഞെടുക്കുക (ബേസ്റ്റ് vs എപ്പോഴും ഓണാണ്). വെയ്റ്റ് ഷിപ്പുകൾക്കുള്ള സംഭരണം ഉദാഹരണം ഉപയോഗിച്ച് അല്ലെങ്കിൽ നിങ്ങളുടെ ബക്കറ്റ് മൌണ്ട് ചെയ്യുക.

  2. സ്റ്റാക്ക് വിന്യസിക്കുക

    ഒരു സെർവിംഗ് ഇമേജ് അല്ലെങ്കിൽ SSH ൽ ആരംഭിക്കുക, CUDA ഡ്രൈവറുകൾ ഇൻസ്റ്റാൾ ചെയ്യുക, ചെക്ക്‌പോസ്റ്റുകൾ ലോഡ് ചെയ്യുക. മോഡൽ തയ്യാറാണെന്ന് ആരോഗ്യ പരിശോധനകൾ സ്ഥിരീകരിക്കുന്നു.

  3. എൻഡ്‌പോയിൻ്റ് രജിസ്റ്റർ ചെയ്യുക

    വർക്ക്‌സ്‌പേസ് ക്രമീകരണത്തിൽ അടിസ്ഥാന URL, API കീ, മോഡൽ ഐഡി എന്നിവ ചേർക്കുക. തത്സമയമാകുന്നതിന് മുമ്പ് ഡിജിയോ ലേറ്റൻസിയും ടോക്കൺ ഫോർമാറ്റും സാധൂകരിക്കുന്നു.

  4. ഏജൻ്റുമാരെ ഏൽപ്പിക്കുക

    തിരഞ്ഞെടുത്ത ഏജൻ്റുമാർക്ക് ഡിഫോൾട്ടായി നിങ്ങളുടെ സ്വകാര്യ മോഡൽ തിരഞ്ഞെടുക്കുക; നിയന്ത്രിത ക്ലോഡ്/ജിപിടി മോഡലുകൾ അടുത്തടുത്തായി ലഭ്യമാണ്.

ജിപിയു വാടകയ്ക്ക് ഡിജിയോ പ്ലാൻ സബ്‌സ്‌ക്രിപ്‌ഷനുകളിൽ നിന്ന് പ്രത്യേകമായി ബിൽ ഈടാക്കുന്നു. ശേഷി ആസൂത്രണം ചെയ്യുന്നതിനും SLA-കൾക്കും നിലവിലുള്ള ഒരു അനുമാന ക്ലസ്റ്ററിൽ നിന്നുള്ള മൈഗ്രേഷനും ഞങ്ങളെ ബന്ധപ്പെടുക.

പതിവുചോദ്യങ്ങൾ

മോഡലുകളും GPU ചോദ്യങ്ങളും

ഡിജിയോയിൽ നിയന്ത്രിത API-കൾ vs സെൽഫ് ഹോസ്‌റ്റ് ചെയ്‌ത അനുമാനം തിരഞ്ഞെടുക്കുന്നു.

ഞാൻ രണ്ടുതവണ പണമടയ്ക്കണോ-പ്ലാൻ പ്ലസ് API?

നിങ്ങളുടെ ഡിജിയോ സബ്‌സ്‌ക്രിപ്‌ഷനിൽ ഇൻഫ്രാസ്ട്രക്ചർ, ഏജൻ്റുമാർ, ഡിജിയോ ടോക്കണുകൾ എന്നിവ ഉൾപ്പെടുന്നു. യഥാർത്ഥ ഇൻപുട്ട്/ഔട്ട്‌പുട്ട് ടോക്കണുകൾ വഴി ടോക്കൺ ബാലൻസ് നിയന്ത്രിത മോഡൽ ഉപയോഗ ഡെബിറ്റുകൾ. നിങ്ങൾ നിയന്ത്രിക്കുന്ന മെഷീനുകൾക്കുള്ള ഒരു ആഡ്-ഓൺ ആണ് ജിപിയു വാടകയ്‌ക്കെടുക്കൽ.

വ്യത്യസ്ത ഏജൻ്റുമാർക്ക് വ്യത്യസ്ത മോഡലുകൾ ഉപയോഗിക്കാൻ കഴിയുമോ?

അതെ-ഓരോ ഏജൻ്റിനും അതിൻ്റേതായ സ്ഥിരസ്ഥിതി ഉണ്ടായിരിക്കാം. ഗ്ലോബൽ ഡിഫോൾട്ട് മാറ്റാതെ തന്നെ ടാസ്‌ക്കുകൾക്കും ചാറ്റുകൾക്കും ഒറ്റ റണ്ണിന് അസാധുവാക്കാനാകും.

സോണറ്റും ഓപസും തമ്മിലുള്ള വ്യത്യാസം എന്താണ്?

കഠിനമായ യുക്തിക്കും ദൈർഘ്യമേറിയ യോജിച്ച പദ്ധതികൾക്കുമായി ഓപസ് ട്യൂൺ ചെയ്തിട്ടുണ്ട്; ദൈനംദിന ഏജൻ്റ് ലൂപ്പുകൾക്ക് സോണറ്റ് വേഗതയേറിയതും വിലകുറഞ്ഞതുമാണ്. വോളിയം സബ് ടാസ്‌ക്കുകൾക്ക് ഹൈക്കു, ഫ്ലാഷ്-ക്ലാസ് മോഡലുകൾ മികച്ചതാണ്.

എനിക്ക് എൻ്റെ സ്വന്തം മോഡൽ മാത്രം പ്രവർത്തിപ്പിക്കാനും ക്ലൗഡ് API-കൾ തടയാനും കഴിയുമോ?

എൻ്റർപ്രൈസ് വർക്ക്‌സ്‌പെയ്‌സിന് ഔട്ട്‌ബൗണ്ട് മോഡൽ ദാതാക്കളെ നിയന്ത്രിക്കാനും നിങ്ങളുടെ ജിപിയു എൻഡ്‌പോയിൻ്റിലേക്ക് എല്ലാ ഏജൻ്റ് ട്രാഫിക്കും റൂട്ട് ചെയ്യാനും കഴിയും. മിക്ക ടീമുകളുടെയും ഡിഫോൾട്ടാണ് ഹൈബ്രിഡ് മോഡ്.

ഏത് GPU വലുപ്പങ്ങൾ ലഭ്യമാണ്?

ഓഫറുകൾ പ്രദേശത്തെയും ആവശ്യത്തെയും ആശ്രയിച്ചിരിക്കുന്നു—സാധാരണയായി 7B–70B ക്ലാസ് മോഡലുകൾക്ക് 24–80 GB VRAM ടയറുകളും വലിയ സ്റ്റാക്കുകൾക്ക് മൾട്ടി-ജിപിയു നോഡുകളും. നിങ്ങളുടെ പാരാമീറ്റർ എണ്ണത്തിൽ നിന്നും ക്വാണ്ടൈസേഷനിൽ നിന്നും വലുപ്പം VRAM-നെ ഞങ്ങൾ സഹായിക്കുന്നു.

സ്വകാര്യ ജിപിയു ഉപയോഗം ഇപ്പോഴും ഡിജിയോ ടോക്കണുകൾ ഉപയോഗിക്കുന്നുണ്ടോ?

ഓർക്കസ്ട്രേഷൻ (ഏജൻ്റുകൾ, ടാസ്ക്കുകൾ, സ്റ്റോറേജ്) നിങ്ങളുടെ പ്ലാനിൽ തുടരും. നിങ്ങളുടെ GPU-യെക്കുറിച്ചുള്ള അനുമാനം GPU സമയമായി കണക്കാക്കുന്നു; ആന്തരിക ചാർജ്ബാക്കിനായി നിങ്ങൾക്ക് ടോക്കൺ ആകൃതിയിലുള്ള ഉപയോഗം ഓപ്ഷണലായി കണക്കാക്കാം.

നിയന്ത്രിത മോഡലുകൾ തിരഞ്ഞെടുക്കുക അല്ലെങ്കിൽ നിങ്ങളുടെ GPU കൊണ്ടുവരിക

ഇന്ന് ക്ലോഡിലും GPT-ലും ആരംഭിക്കുക, തുടർന്ന് ഇഷ്‌ടാനുസൃത ഭാരം-അതേ ഏജൻ്റുകൾ, സമാന ടാസ്‌ക്കുകൾ, നിങ്ങളുടെ അനുമാനം എന്നിവ ഹോസ്റ്റുചെയ്യാൻ നിങ്ങൾ തയ്യാറാകുമ്പോൾ സമർപ്പിത GPU ചേർക്കുക.