DeepSeek ആര്ട്ടിഫിഷ്യല് ഇന്റലിജന്സ് ഇന്നൊവേഷന്! പുറത്തിറങ്ങി ഒരാഴ്ച കൊണ്ട് അമേരിക്കന് ടെക് ഭീമന്മാരുടെയൊക്കെ ഓഹരി വിലയ്ക്ക് ഇളക്കം തട്ടിച്ച കുഞ്ഞന് ചൈനീസ് കമ്പനിയും അവരുടെ കഥകളും വാര്ത്തകളില് നിറയുകയാണ്.
കഴിഞ്ഞയാഴ്ച അവര് റിലീസ് ചെയ്ത DeepSeek R1 എന്ന ആര്ട്ടിഫിഷ്യല് ഇന്റലിജന്സ് ടൂളാണ് താരം. ഈ മേഖലയിലെ വമ്പന്മാരായ ചാറ്റ് ജി.പി.ടി, ഗൂഗിള് ജെമിനൈ, മെറ്റ, മറ്റനേകം പ്രൊഡക്ടുകള് എന്നിവയ്ക്കൊക്കെ Deep Seek R1 വെല്ലുവിളി ഉയര്ത്തിക്കഴിഞ്ഞു.
എല്ലാ ടെക് ഓഹരികളിലും ചാഞ്ചാട്ടമുണ്ടായെങ്കിലും ഏറ്റവും വലിയ ഇടിവുണ്ടായത് NVIDIA എന്ന ഹാര്ഡ്വെയര് ചിപ്പ് നിര്മാണ കമ്പനിയ്ക്കായിരുന്നു. കഴിഞ്ഞ അഞ്ച് ദിവസങ്ങള്ക്കിടെ അവരുടെ ഓഹരി 15% ഇടിഞ്ഞു.
അമേരിക്കയ്ക്ക് പുറത്ത് നിന്ന് ടെക് ലോകത്ത് ആദ്യമായി ഇത്ര വലിയ ചലനം ഉണ്ടാക്കിയ DeepSeek എന്താണ് ചെയ്തത് എന്ന് അന്വേഷിക്കുന്നതിന് മുന്പ് കുറച്ച് സംഗതികള് മനസ്സിലാക്കേണ്ടതുണ്ട്.
DeepSeek ഒരു സാധാരണ ഗെയിമിങ് കമ്പ്യൂട്ടറില് പോലും നിങ്ങള്ക്ക് ലോഡ് ചെയ്ത് ട്രെയ്നിങ് നടത്താനും പ്രവര്ത്തിപ്പിക്കാനും സാധിക്കും എന്നതാണ് ഇതിലെ ഏറ്റവും പ്രധാന സംഗതി.
നിലവിലുള്ള മുന്നിര ആര്ട്ടിഫിഷ്യല് ഇന്റലിജന്സ് മോഡലുകളെ ട്രെയ്ന് ചെയ്യാന് വമ്പന് കംപ്യൂട്ടിങ് ശേഷിയും അതൊക്കെ പ്രവര്ത്തിപ്പിക്കാന് വന്തോതില് ഊര്ജവും ഉപയോഗിക്കുന്നുണ്ട്.
ഉദാഹരണത്തിന് ഓപ്പണ് എ.ഐയുടെ ജി.പി.ടി-4 മോഡലിനെ ട്രെയ്ന് ചെയ്യാന് എസ്റ്റിമേറ്റ് ചെയ്ത തുക ഏകദേശം 100 മില്യണ് ഡോളര് (850 കോടി രൂപ) ആയിരുന്നു. ഇതെല്ലാം ചെലവാക്കിയത് കംപ്യൂട്ടിങ് ശേഷിക്ക് ആവശ്യമായ സി.പി.യു (CPU), ജി.പി.യു (GPU) എന്നിവയ്ക്കും ഡാറ്റ സെന്ററിലേക്ക് വേണ്ട ഊര്ജാവശ്യങ്ങള്ക്കും വേണ്ടി മാത്രമായിരുന്നു. പ്രോഡക്ട് റിസര്ച്ച്, എഞ്ചിനീയറിങ് ചെലവുകള് ഇതിന് പുറമെയാണ്.
ആര്ട്ടിഫിഷ്യല് ഇന്റലിജന്സിന് ആവശ്യമുള്ള കംപ്യൂട്ടിങ് ശേഷിക്ക് വേണ്ടി എല്ലാവരും ഇപ്പോള് ആശ്രയിക്കുന്നത് NVIDIAയെ ആണ്. അവരുടെ പുതുതലമുറ ജി.പി.യുകള് ആണ് ഒട്ടുമിക്ക എ.ഐ മോഡലുകളെയും പ്രവര്ത്തിപ്പിക്കുന്നത്.
ഏകദേശം 35 ലക്ഷത്തോളം രൂപ ഒരെണ്ണത്തിന് വിലയുള്ള പതിനായിരക്കണക്കിന് NVIDIA H100 ജി.പി.യുകള് ആണ് മുന്നിരക്കാരൊക്കെ എ.ഐ ട്രെയിനിങ്ങിനും മോഡലുകളെ പ്രവര്ത്തിപ്പിക്കാനുമായി ഒരേ സമയം ഉപയോഗിക്കുന്നത്.
ഈ മേഖലയിലെ കുത്തകയായി മാറിയതോടെയാണ് വിപണിമൂല്യത്തില് ലോകത്തെ മുന്നിരയിലേക്ക് NVIDIA അടുത്ത കാലത്ത് എത്തിയത്. ഇത്തരം ഭീമമായ തുക ആവശ്യമുള്ളത് കൊണ്ട് മള്ട്ടി മില്യണ് ഡോളര് വിപണി മൂല്യമുള്ള കമ്പനികള്ക്ക് പോലും ഒരുപക്ഷേ അപ്രാപ്യമായ രീതിയില് ആയിരുന്നു എ.ഐ ഡെവലപ്പ്മെന്റിന്റെ പോക്ക്.
അവിടെയാണ് ഈ മേഖലയില് ഇതുവരെ കേട്ടിട്ടില്ലാത്ത DeepSeek അഞ്ചര മില്യണ് ഡോളര് (അന്പത് കോടി രൂപ) ചെലവില് വമ്പന്മാരോട് കിടപിടിക്കുന്നതോ അതിനേക്കാള് മികച്ചതോ ആയ എ.ഐ മോഡലുമായി കടന്നുവന്ന് അത്ഭുതം സൃഷ്ടിച്ചത്.
പല മേഖലയിലും ജി.പി.ടി-4നേക്കാളും മികച്ച റിസള്ട്ട് DeepSeek തരുന്നുണ്ട് എന്ന് എ.ഐ മോഡലുകളെ ബെഞ്ച്മാര്ക്ക് ചെയ്യുന്ന പല പരീക്ഷണങ്ങള് വഴി ഇതിനകം തന്നെ തെളിഞ്ഞു കഴിഞ്ഞു.
Deepseek അവരുടെ പ്രൊഡക്ട് അവതരിപ്പിക്കുക മാത്രമല്ല ചെയ്തത്. അതിന്റെ സോഴ്സ് കോഡും, എങ്ങിനെ ഇത് സാധിച്ചു എന്ന വിശദമായ ടെക്നിക്കല് റിപ്പോര്ട്ടും പബ്ലിഷ്ചെയ്തു.
ഓപ്പണ് സോഴ്സ് ആയി കോഡ് ലഭ്യമാക്കിയിട്ടുള്ളത് കൊണ്ട് അതുപയോഗിച്ച് മറ്റുള്ളവര്ക്ക് പുതിയ പ്രൊഡക്ടുകള് നിര്മ്മിക്കാനും കോഡ് മെച്ചപ്പെടുത്തി ഇതിനേക്കാള് മികച്ച എ.ഐ മോഡലുകള് നിര്മിക്കാനും സാധിക്കും.
ഓപ്പണ് സോഴ്സില് വന്കിട മോഡലുകള് പലതും ഇപ്പോള് തന്നെ ലഭ്യമാണെങ്കിലും പ്രവര്ത്തിപ്പിക്കാന് വന്കിട മൂലധന നിക്ഷേപം വേണ്ടതുകൊണ്ട് മാത്രം മാറി നിന്ന പലര്ക്കും എ.ഐയുടെ കോര് ഡെവലപ്പ്മെന്റിലേക്ക് തിരിച്ച് പ്രവേശിക്കാന് ഇത് വഴി തുറന്നു.
‘മികച്ച എ.ഐയ്ക്ക് കരുത്തുറ്റ കൂടുതല് ജി.പി.യുകള്’ എന്നതായിരുന്നു ഈ മേഖലയിലെ പൊതുവായ വിജയമന്ത്രം. ലളിതമായി പറഞ്ഞാല് Deep Seek അത് മാറ്റിമറിച്ചു.
പുറത്ത് ലഭ്യമായ കണക്കുകള് ശരിയാണെങ്കില് ഒരു ലക്ഷത്തോളം വരുന്ന, ഏറ്റവും ആധുനികമായ ജി.പി.യുകള് ഉപയോഗിച്ച് ഓപ്പണ് എ.ഐ ജി.പി.ടി-4നെ ട്രെയ്ന് ചെയ്തതെങ്കില് അത്ര നൂതനമൊന്നുമല്ലാത്ത ആയിരത്തോളം ജി.പി.യുകള് ഉപയോഗിച്ചാണ് DeepSeek അതേ കാര്യം സാധ്യമാക്കിയത്. നൂറില് ഒന്ന് കംപ്യൂട്ടിങ് ശേഷി മാത്രം ഉപയോഗിച്ച്!
അമേരിക്കയുടെ നിരോധനം നിലനില്ക്കുന്ന സമയത്ത് തന്നെ ഏറ്റവും നൂതനമായ കംപ്യൂട്ടിങ് ചിപ്പുകളും അറിവും ചൈനയ്ക്ക് ലഭിക്കുന്നതെങ്ങനെയെന്ന് എല്ലാവരും മൂക്കത്ത് വിരല് വെക്കുന്നുണ്ട്. പലവിധ സിദ്ധാന്തങ്ങളും അഭിപ്രായങ്ങളും ഉയര്ന്നുവരുന്നുണ്ടെങ്കിലും വിശ്വസനീയമായി തോന്നിയത് ‘ആവശ്യം സൃഷ്ടിയുടെ മാതാവാകും’ എന്നാരോ ഇതേ കുറിച്ച് കമന്റ് ചെയ്തതാണ്.
അതെ, ചൈനയുടെ മേലുള്ള ഉപരോധങ്ങള് തന്നെയാണ് ഇപ്പോള് ലോകത്തെ മുഴുവന് ജനതയ്ക്കും ഭാവിയില് പ്രയോജനം ചെയ്തേക്കാവുന്ന ഒന്നിലേക്ക് ഇത്ര വേഗം എത്തിച്ചത്. അല്ലെങ്കില് ഒരു പക്ഷേ ഭീമന് കമ്പനികളുടെ കുത്തകയായി മാറിയേക്കാമായിരുന്ന ഒന്നിനെ മാറ്റിമറിച്ചത്.
എങ്ങിനെ ഇത് സാധിച്ചു? ഹാര്ഡ്വെയര് റിസോഴ്സുകളുടെ ഉപയോഗം പരമാവധി കുറയ്ക്കുന്ന രീതിയില് അവര് നടത്തിയ സോഫ്റ്റ്വെയര് തലത്തിലുള്ള ഒപ്റ്റിമൈസേഷനാണ് ഇതില് ഏറ്റവും പ്രധാനം.
Benchmark performance of DeepSeek-V3 and its counterparts.
ഉദാഹരണത്തിന് എല്ലാ മോഡലുകളിലും ദശാംശസംഖ്യകളുടെ കൃത്യതയ്ക്ക് വേണ്ടി 32 ബിറ്റുകള് ഉപയോഗിക്കുമ്പോള് DeepSeek അത് 8 ബിറ്റുകളായി കുറച്ചു. അതുവഴി ഒറ്റയടിക്ക് 75% മെമ്മറി ഉപയോഗം കുറക്കാന് അവര്ക്ക് കഴിഞ്ഞു.
ജി.പി.ടി-4 ഉള്പ്പടെയുള്ള മുന്നിര മോഡലുകള് എല്ലാം മാസീവ് മോഡലുകള് (Massive Model) ആണ്. ജി.പി.ടി-4ല് ഏകദേശം 1.8 ട്രില്യണ് പാരാമീറ്ററുകള് ആക്ടീവായി നിന്നുകൊണ്ടാണ് നമ്മുടെ ചോദ്യങ്ങള്ക്ക് ഉത്തരം തരുന്നത്.
ഇത്തരം ലാര്ജ് ലാംഗ്വേജ് മോഡലുകള് പ്രവര്ത്തിക്കാനാവശ്യമായ പാരാമീറ്ററുകളുടെ എണ്ണവും Deep Seek ഒപ്റ്റിമൈസ് ചെയ്ത് ആകെ 671 ബില്യണാക്കി ചുരുക്കി. ജി.പി.ടി-4ന് ആവശ്യമുള്ളവയുടെ മുന്നിലൊന്ന് മാത്രം. ഇതില് തന്നെ ഒരേ സമയം ആക്ടീവ് ആകുന്നത് 37 ബില്യണ് എണ്ണവും.
DeepSeek സത്യത്തില് ഒട്ടനവധി എക്സ്പേര്ട്ട് സിസ്റ്റങ്ങളുടെ ഒരു കളക്ഷന് ആണെന്ന് പറയാം. അതായത് അതിനോടുള്ള ചോദ്യത്തിന്റെ കോണ്ടെക്സ്റ്റ് മനസ്സിലാക്കി ആവശ്യമുള്ള എക്സ്പേര്ട്ട് സിസ്റ്റം മാത്രമാണ് ആക്ടീവ് ആകുക.
ഉദാഹരണത്തിന് മെഡിക്കല് ചോദ്യമാണെങ്കില് അതുമായി ബന്ധപ്പെട്ട എക്സ്പേര്ട്ട് സിസ്റ്റവും ലീഗല് ചോദ്യമാണെങ്കില് അതുമായി ബന്ധപ്പെട്ട സിസ്റ്റവുമായിരിക്കും ആക്ടീവ് ആകുക. ഇങ്ങനെ പലവിധ മാറ്റങ്ങള് വരുത്തിയാണ് ജി.പി.യു ഉപയോഗം ചിന്തിക്കാനാവാത്ത വിധം കുറച്ചത്.
DeepSeek ഒരു സാധാരണ ഗെയിമിങ് കമ്പ്യൂട്ടറില് പോലും നിങ്ങള്ക്ക് ലോഡ് ചെയ്ത് ട്രെയ്നിങ് നടത്താനും പ്രവര്ത്തിപ്പിക്കാനും സാധിക്കും എന്നതാണ് ഇതിലെ ഏറ്റവും പ്രധാന സംഗതി.
NVIDIA യുടേതായി പുറത്തിറങ്ങിയതും ഭാവിയിലേക്ക് അനൗണ്സ് ചെയ്തിട്ടൂള്ളതുമായ സൂപ്പര് ചിപ്പുകള് ഉപയോഗിക്കാതെ തന്നെ എ.ഐ ഗവേഷണവും ഡെവലപ്പ്മെന്റും ഉപയോഗവും സാധ്യമാകും.
എ.ഐ ഇപ്പോള് ക്ലൗഡില് നിന്നും SAAS ആയി ഉപയോഗിക്കുന്നവര്ക്ക് ഓപ്പണ് എ.ഐയില് ഒരു മില്യണ് ടോക്കണുകള്ക്ക് 4.4 ഡോളര് (400 രൂപ) ചെലവുണ്ടെങ്കില് Deep Seek ഒരു മില്യണ് ടോക്കണുകള് ഓഫര് ചെയ്യുന്നത് വെറും 10 സെന്റിന് (8 രൂപ) ആണെന്നതും കൂടി ചേര്ത്ത് വായിക്കുമ്പോഴാണ് ഈ കുഞ്ഞന് ചൈനീസ് കമ്പനി കൊണ്ട് വരുന്ന ഡിസ്റപ്ഷന്റെ ആഴവും പരപ്പും മനസ്സിലാകൂ.
Content Highlight: Joy Sebastian writes about DeepSeek and AI