ഡീപ്സീക് ഇറങ്ങിയതുമായി ബന്ധപ്പെട്ട് നിരവധി ചര്ച്ചകള് നടക്കുകയാണല്ലോ? ഇത് ചൈനയുടെ ഒരു പൊളിറ്റിക്കല് വെപ്പണ് ആണ്, ഡാറ്റ ചോര്ത്തും, വിശ്വസിക്കാമോ, മാല്വെയറുകള് ഉണ്ടാകും ഇങ്ങിനെ നിരവധി ആശങ്കകള് കൂടാതെ, ചൈനയെ സംബന്ധിച്ച കാര്യങ്ങള് ചര്ച്ച ചെയ്യുന്നില്ല, ഇങ്ങിനെ പോകുന്നു ആവലാതികള്. സാഹചര്യവശാല് ഇതിനെപ്പറ്റി കുറെ എഴുതിയത് വച്ച് ചില കാര്യങ്ങള് പങ്ക് വയ്ക്കാം.
ഡീപ്സീക്, ചാറ്റ്ജിപിറ്റി എന്നിവയെല്ലാം ലാര്ജ് ലാംഗ്വേജ് മോഡലുകള് ആണ്, നിലവില് അവ ആരുടെയും കുത്തക അല്ല. ഇവയെല്ലാം ഗൂഗിള് ലാബില് നിന്ന് 2017ല് വന്ന ഒരു പേപ്പറില് പറയുന്ന ട്രാന്സ്ഫോര്മര് മോഡലിനെ അടിസ്ഥാനമാക്കി നിര്മ്മിക്കപ്പെട്ടവയാണ്.
സ്വാഭാവികമായും ഇതില് മുന്നേറ്റം ഉണ്ടാവേണ്ടത് ഗൂഗിളിന് ആണെങ്കിലും അവര്ക്ക് ഡീപ്മൈന്ഡ് പോലെയുള്ള മികച്ച എ.ഐ സങ്കേതങ്ങള് ഉണ്ടെങ്കിലും ജനറേറ്റീവ് എ.ഐ മോഡല് ഉപയോഗിച്ച് മികച്ച ബ്രേക്ക്ത്രൂ ഉണ്ടാക്കിയത് ഓപ്പണ്എ.ഐ എന്ന കുഞ്ഞന് കമ്പനിയാണ്.
ഗൂഗിളിനെ ഞെട്ടിച്ച ഇവര് മുന്നേറ്റം തുടര്ന്നു. ഇവരുടെ മോഡലിനും ഇതേ പോലെ മോഡലുകള് ഉണ്ടാക്കിയ ഗൂഗിള്, ആന്ത്രോപിക് എന്നിവര്ക്കൊക്കെ ലോകത്തുള്ള വിജ്ഞാനം മുഴുവന് ടോക്കണുകള് ആക്കി ട്രെയിന് ചെയ്തു ഇറക്കാന് വേണ്ടി വന്നത് ഭീമമായ ഹാര്ഡ്വെയര് കപ്പാസിറ്റി ആണ്.
ഫലത്തില് അതിന് വേണ്ട ജി.പി.യു ചിപ്പുകള് ഉണ്ടാക്കുന്ന എന്വീഡിയ എന്ന കമ്പനിയുടെ ഷെയര് അടിച്ച് കയറി. അവര് ഡിസൈന് ചെയ്യുന്ന ചിപ്പുകള് ഉണ്ടാക്കുന്ന തൈവാന് കമ്പനിയായ ടി.എസ്.എം.സിക്ക് വരുമാനവും കൂടി. എന്നാല് ഡീപ്സീക് അതേ മോഡല് കുറഞ്ഞ ചെലവിലും ഹാര്ഡ്വെയര് റിസോഴ്സിലും ഉണ്ടാക്കി കാണിച്ചപ്പോഴാണ് ഇപ്പോള് നടക്കുന്ന പുകില് എല്ലാം ഉണ്ടായത്.
ഡീപ്സീക് അല്ഗോരിതം കുറച്ച് സ്മാര്ട്ട് ടെക്നിക്കുകള് ഉപയോഗിച്ചതിനാല് ആണ് അവരുടെ മോഡല് കുറഞ്ഞ ചെലവില് മികച്ച ഫലം തന്നത്. അത് ഉണ്ടാകാന് കാരണം ആ ടീമില് ഉള്ളവര്ക്ക് ഇതിന്റെ ഗണിതം, കമ്പ്യൂട്ടര് എഞ്ചിനീയറിംഗ്, ഹാര്ഡ്വെയര് ഒക്കെ സംബന്ധിച്ച മികച്ച ധാരണ ഉള്ളത് കൊണ്ടാണ്.
ജി.പി.ടി മോഡല് കോപ്പി അടിച്ചെന്ന് സാം ആള്ട്ട്മാന് പോലും ആരോപിച്ചിട്ടില്ല.
സാം ആള്ട്ട്മാന്
ഇനി ഇവര് മാത്രമല്ല മൂണ്ഷോട്ട് എന്നൊരു കമ്പനിയും കിമി എന്ന മികച്ച മോഡലുമായി വന്നിട്ടുണ്ട്. നിലവില് ചാറ്റ്ജിപിറ്റി, ഗൂഗിള് ജെമിനി ഒക്കെപ്പോലെ ഒരു സോഫ്റ്റ്വെയര് സേവനം എന്ന രീതിയില് അല്ല ഇത് വന്നിട്ടുള്ളത്, പകരം നമുക്ക് ഡൗണ്ലോഡ് ചെയ്തു നമ്മുടെ കമ്പ്യൂട്ടറില് ഓടിക്കാന് പറ്റുന്ന ഒരു മോഡല് ആയിട്ടാണ്. അതാണ് ഇത് വരെയുള്ള മോഡലുകളില് നിന്ന് ഇതിനെ വ്യത്യസ്തമാക്കുന്നത്. ഏകദേശം 6000 ഡോളര് ഉണ്ടെങ്കില് ഇത് ഫുള് സ്കെയിലില് നമുക്ക് റണ് ചെയ്യാം.
ഇവിടെ മനസ്സിലാക്കേണ്ടത് അവരുടെ ഏറ്റവും പുതിയ മോഡല് ആയ DeepSeek-V3 അവര് ടെസ്റ്റ് ചെയ്തു പുറത്തിറക്കിയതിനൊപ്പം അതിന്റെ മൊത്തം സോഴ്സ്-കോഡ് കൂടി ഗിറ്റ്ഹബ്ബിലൂടെയും മറ്റും പുറത്ത് വിട്ടിട്ടുണ്ട്. ഇത് മറ്റാരും മുന്നേ ചെയ്യാത്ത കാര്യമാണ്.
അത് നമുക്ക് ഡൗണ്ലോഡ് ചെയ്ത് നമ്മുടെ മൊബൈല് ഫോണ്, പിസി, ലാപ്ടോപ്, സെര്വര് തുടങ്ങി എന്തിലും ഇട്ട് ഒടിക്കാം. ഇന്സ്റ്റാള് ചെയ്തു കഴിഞ്ഞാല് ഇന്റര്നെറ്റ് കണക്ഷന് ഒന്നും വേണ്ട, നമുക്ക് വേണ്ട സ്കെയിലില് ഉള്ള ആവശ്യങ്ങള്ക്ക് ഉപയോഗിക്കാം.
ഈ മോഡല് ന്യൂറല് നെറ്റ്വര്ക്കില് ട്രെയിന് ചെയ്ത ഇത് വരെയുള്ളതില് ഏറ്റവും മികച്ചതാണ് എന്ന് ടെക് ലോകം തിരിച്ചറിഞ്ഞ് കഴിഞ്ഞു. എത്തിക്കല് അല്ലാത്ത ചോദ്യങ്ങള് ഇത് ബ്ലോക്ക് ചെയ്യുന്ന പോലെ പൊളിറ്റിക്കല് ചോദ്യങ്ങളുടെയും ഉത്തരങ്ങള് സപ്രസ് ചെയ്യും.
എന്നാല് അത് നമ്മുടെ ലോക്കല് ഡിപ്ലോയ്മെന്റില് നമുക്ക് അത് പരിഹരിക്കാം. പക്ഷേ അതിന് പണച്ചെലവ് ഉണ്ടാകും – ഹാര്ഡ്വെയര്, മാന്പവര് ഒക്കെ വേണ്ടി വരും. അത് പറ്റാത്തവര്ക് വലിയ മോഡലിന്റെ ഡിസ്റ്റില് ചെയ്ത ചെറിയ മോഡല് ഫോണിലും ലാപ്ടോപ്പിലുമൊക്കെ ഇന്സ്റ്റാള് ചെയ്യാം. ഡിസ്റ്റില് ചെയ്തത് ഒരു കുട്ടിയും, മറ്റേത് ഒരു മാഷും ഉപയോഗിക്കുന്നത് എന്ന് കരുതിയാല് മതി.
നിലവിലെ എ.ഐ കുത്തകകള് നമുക്ക് മോഡല് തരണമെങ്കില് APIക്ക് കാശ് കൊടുക്കണമായിരുന്നു ഡീപ്സീക് തല്ക്കാലം കൊമേഴ്സ്യല് പ്ലാന് ഇല്ലാത്തതിനാല് ചെറിയ ചാര്ജ് മാത്രമേ APIക്ക് ഈടാക്കുന്നുള്ളൂ എന്ന് തോന്നുന്നു. സോഴ്സ് കോഡ് മൊത്തം സൗജന്യമായി ഡൗണ്ലോഡ് ചെയ്യാനും അനുവദിക്കും. അതിനാലാണ് OpenAI ക്ലോസ്ഡ് ആണ് എന്ന മീമുകള് ഇറങ്ങിയത്.
ഇവര് മാത്രമല്ല, ഓണ്ലൈന് മോഡില് ഇടുന്ന ഏത് എ.ഐ മോഡലും നിങ്ങളുടെ ഡാറ്റ അവരുടെ സെര്വറില് ശേഖരിക്കുകയും, അവരുടെ ഭാവി ട്രെയിനിംഗിന് ഉപയോഗിക്കുകയും ചെയ്യും. അത് വേണ്ട എന്നുണ്ടെങ്കില് നമുക്ക് ലോക്കല് ആയി റണ് ചെയ്യണം. ഒന്നുകില് ഗൂഗിള്, ഓപ്പണ്എ.ഐ, ആന്ത്രോപിക്, മെറ്റാ, ടെസ്ല എന്നിവര്ക്ക് പണം കൊടുത്തു നമുക്ക് LLM ആപ്ലിക്കേഷനുകള് റണ് ചെയ്യാം.
ആര്ക്കായാലും ഡേറ്റ സെക്യൂരിറ്റി, പ്രൈവസി എന്നിവ ഉറപ്പാക്കേണ്ടത് നമ്മുടെ കൂടി ആവശ്യമാണ്. അപ്പോള് ആപ്പ് വേറെ, മോഡല് വേറെ എന്നതാണ് കാര്യം. അവര് രഹസ്യമാക്കി വച്ചെന്ന് ലോകം കരുതുന്നത് ട്രെയിനിങ് എങ്ങിനെ നടത്തി എന്നത് മാത്രമാണ്.
എന്നാല് ഓപ്പന്സോഴ്സ് കോഡ് പുറത്ത് വിട്ടതിനാല് ഇത് ആര്ക്കും പരീക്ഷിച്ച് തട്ടിപ്പാണോ എന്ന് പരിശോധിക്കാമല്ലോ. മാത്രമല്ല DALL-E എന്ന സോഫ്റ്റ്വെയര് മോഡല് പോലെ ചിത്രങ്ങള് ഉണ്ടാക്കുന്ന ജാനസ് പ്രോ എന്നത് അവര് ആപ്പില്ലാതെ നേരെ സോഴ്സ് കോഡും, അതിന്റെ റിസര്ച്ച് പേപ്പറും സഹിതം പുറത്ത് വിട്ടിട്ടുണ്ട്.അത് ആര്ക്ക് വേണമെങ്കിലും ലോക്കല് ആയി ഉപയോഗിക്കാം.
നമൂക്ക് ഇത് ഓണ്ലൈന് ആയി ഉപയോഗിക്കണമെങ്കില് ഫോണ് നമ്പര് കൊടുത്ത് രജിസ്റ്റര് ചെയ്യണം. ഉപയോഗിക്കുമ്പോള് നമ്മള് കൊടുക്കുന്ന ഡാറ്റയും അവര് ഉപയോഗിച്ചെന്നിരിക്കും. ഈ റിസ്ക് എടുക്കാന് തയ്യാറുള്ളവരെ ഇത് ഓണ്ലൈന് ആപ്പ് ആയി ഉപയോഗിക്കാന് പാടുള്ളു. ചാറ്റ്ജിപിറ്റി അടക്കം എല്ലാവരും ഇതേ കാര്യം ചെയ്യുന്നുണ്ട്.
ഇത് പുറത്തിറക്കിയ കമ്പനി ഫിനാനിഷ്യല് മാര്ക്കറ്റില് പണമുണ്ടാക്കിയ ചെറുപ്പക്കാരുടെ സംരംഭം ആണ്. കഴിഞ്ഞ വര്ഷം പകുതിക്ക് അവര് ചൈനയിലെ എ.ഐ ഭീമന്മാരുടെ ഷെയര് വാല്യൂ എല്ലാം ഇടിച്ചിട്ടാണ് പുതിയ മോഡല് ഇറക്കി ലോകമങ്ങും റിലീസ് ചെയ്തത്.
ചൈനയില് എല്ലാ കമ്പനികള്ക്കും കിട്ടുന്ന സംരക്ഷണം ഇവര്ക്കും ഉണ്ടാകും. എന്നാല്, ഇവര് എല്ലാ രാജ്യങ്ങളിലേയും ലിഗല് ഫ്രെയിംവര്ക്കുകള് പാലിച്ചാല് മാത്രമേ അതത് രാജ്യങ്ങളില് ആപ്പ് സ്റ്റോറില് ഇറക്കാന് പറ്റൂ. അവരുടെ ആപ്പ് ഇന്സ്റ്റാള് ചെയ്യണം എന്ന് ഒരു നിര്ബന്ധവുമില്ല. മുകളില് പറഞ്ഞത് പോലെ നമുക്ക് നമ്മുടെ സ്വന്തമാക്കി ഇത് റണ് ചെയ്യാന് പറ്റും.
ചൈന ആയാലും അമേരിക്ക ആയാലും അവരുടെ രാജ്യത്തേക്ക് ഫോറിന് എക്സ്ചേഞ്ച് കൊണ്ട് വരുന്നത് പ്രമോട്ട് ചെയ്യും, നമുക്ക് വേണ്ടെങ്കില് ഉപയോഗിക്കണ്ട കാര്യമില്ല.
ധാരാളം ഡാറ്റ പ്രൊട്ടക്ഷന് റൂളുകള് ഉള്ള യൂറോപ്പില് നിന്നും ഒരു മോഡലും വരുന്നില്ല എന്നതും കാണണം. പൊളിറ്റിക്കലി സെന്സിറ്റീവ് ആയ ഡാറ്റ കൊടുത്തോ ഇല്ലയോ എന്നതല്ല, അതിന്റെ മാത്തമറ്റിക്കല് റീസണിങ് കഴിവാണ് മികച്ച് നില്ക്കുന്നത്.
സാധാരണക്കാര് അതിനാല് ഡീപ്സീക് ഉപയോഗിക്കാന് താല്പര്യമില്ലെങ്കില് ക്ലോഡ് അല്ലെങ്കില് ചാറ്റ്ജിപിറ്റി അല്ലെങ്കില് ജെമിനി, അതുമല്ലെങ്കില് ഇവയുടെ മുകളില് ഇന്ത്യക്കാരന് നിര്മ്മിച്ച പെര്പ്ലക്സിറ്റി ഉപയോഗിക്കുക. പ്രൈവസി ഉറപ്പാക്കുന്നതിനൊപ്പം അവരുടെ വരുമാനവും വര്ദ്ധിക്കും, നമ്മുടെ ഡാറ്റ അവര് പരിശീലനത്തിനും കൊമേര്ഷ്യല് ആവശ്യങ്ങള്ക്കും ഉപയോഗിക്കില്ല എന്ന ഗ്യാരന്റി അവരും തരുന്നില്ല.
സൗജന്യമായി വേണമെങ്കില് ഡീപ്സീക് അവരുടെ മോഡല് ഉപയോഗിച്ച് ഉണ്ടാക്കിയ ചാറ്റ്ബോട്ട് ഉപയോഗിക്കാം, അല്ലങ്കില് ഹഗ്ഗിംഗ്ഫേസ്/ പെര്പ്ലക്സിറ്റി ചാനലുകള് ഉപയോഗിച്ചും ഈ മോഡല് റണ് ചെയ്യാം. ഇനി അത് വേണ്ടെങ്കില് സ്വന്തമായി മൊബൈല് ഫോണില് ഇട്ട് നമ്മുടെ ഒരു കുഞ്ഞന് പോക്കറ്റ് എ.ഐ മോഡല് ആയി വേണമെങ്കില് ഉപയോഗിക്കാം. ഇത് പ്രൈവറ്റ് ആണെന്ന് മാത്രമല്ല ഒരു സര്വറുമായും കണക്റ്റ് ചെയ്യേണ്ടതുമില്ല.
വ്യക്തിഗത/ചെറിയ തോതിലുള്ള ഉപയോഗത്തിന്, 32GB റാം അല്ലെങ്കില് EC2 മെമ്മറി ഒപ്റ്റിമൈസ് ചെയ്ത ഒരു ഡെസ്ക്ടോപ്പിന് ക്വാണ്ടൈസ്ഡ് 7B/14B മോഡലുകള് (നേരത്തെ പറഞ്ഞ ഡിസ്റ്റില് ചെയ്ത മോഡല്) പ്രവര്ത്തിപ്പിക്കാന് കഴിയും. വലിയ മോഡലുകള്ക്കോ ഉപയോഗത്തിനോ, GPU മഷീന്സ് അല്ലെങ്കില് ക്ലൗഡ് അധിഷ്ഠിത സേവനങ്ങളോ ഉപയോഗിച്ച് റണ് ചെയ്യാം. ഇവിടെയും ഡീപ്സീക് സെര്വറുമായി നമുക്ക് ബന്ധമില്ല.
ഒരു സെര്വറില് ഓടിക്കണമെങ്കില് (ഉദാ. AWS EC2 CPU ഉദാഹരണം)
– പൊതുവായ ആപ്ലിക്കേഷന്: 16GB+ RAM ഉള്ള ചെറിയ മോഡലുകള്ക്ക് (7B പാരാമീറ്ററുകള്) അനുയോജ്യം.
– മെമ്മറി ഒപ്റ്റിമൈസ് ചെയ്ത മോഡല്: 64GB+ RAM ഉള്ള വലിയ മോഡലുകള് (ഉദാ. 14B/70B പാരാമീറ്ററുകള്) മികച്ചത്. സിപിയു ജിപിയുവിനേക്കാള് മന്ദഗതിയിലാണ് എന്നതിനാല് മോഡല് സ്ലോ ആയിരിക്കും.
ഇനി ഉയര്ന്ന റാം, ജി.പി.യു ഉള്ള മെഷീനുകള്, ലോക്കല് ക്ലസ്റ്റര് ഒക്കെയുണ്ടെങ്കില് നമുക്ക് വലിയ മോഡലുകള് ആയി ഇത് റണ് ചെയ്യാം. ചുരുക്കത്തില് ഒരു റോബോട്ട് വാങ്ങുന്ന പോലെ കരുതിയാല് മതി.
ചൈനയില് ഉണ്ടാക്കി അവരുടെ സോഫ്റ്റ്വെയര് നിയന്ത്രിക്കുന്ന റോബോട്ട് അങ്ങോട്ട് ഡാറ്റ അയച്ച് നമ്മുടെ കാര്യങ്ങള് നിയന്ത്രിക്കുന്ന അവസ്ഥയാണ് ചാറ്റ്ബോട്ട് ഉപയോഗം. എന്നാല് റോബോട്ട് വാങ്ങി നമ്മുടെ ഇഷ്ടത്തിന് അസംബിള് ചെയ്ത് നമ്മള് പറയുന്ന പോലെ പണി ചെയ്യുന്നതാണ് ഓപ്പന്സോഴ്സ് മോഡല്.
ഇവിടെ റോബോട്ട് അല്ല സോഫ്റ്റ്വെയര് ആയതിനാല് അതിന് കാശ് വേണ്ട എന്നാല് നമ്മുടെ കമ്പ്യൂട്ടര്, കറന്റ്, ഓപ്പറേറ്റര്, മെയ്ന്റനന്സ് എല്ലാത്തിനും നമ്മള് കാശ് മുടക്കണം. ഗൂഗിള്, ആന്ത്രോപിക് ഒക്കെ ആ പണികള് എല്ലാം അവരുടെ ഡേറ്റ സെര്വറുകളിലെ ജി.പി.യു മെഷീനുകള് ഉപയോഗിച്ച് നമുക്ക് കാര്യങ്ങള് ചെയ്ത് തരും. നമ്മള് അതിന് മാസം ചുരുങ്ങിയത് രണ്ടായിരം രൂപ മുതല് മേലോട്ട് കൊടുക്കുക അല്ലെങ്കില് അവരുടെ സൗജന്യ സേവനം ഉപയോഗിക്കുക. ചോയിസ് നമ്മുടേതാണ്.
ഇനി മിക്കവാറും സംഭവിക്കുന്നത് എല്ലാവരും ഇത് ഉപയോഗിച്ച് മികച്ച മോഡലുകള് ഉണ്ടാക്കി ക്യാപിറ്റലിസത്തിന്റെ ശരിയായ സ്വഭാവം അനുസരിച്ച് ബിസിനസ്സ് ഉണ്ടാക്കും. അതാണ് ട്രംപ് പറഞ്ഞത് ഇത് ഒരു അവസരമാണ് അല്ലാതെ കരയേണ്ട സമയമല്ല എന്ന്!
CONTENT HIGHLIGTS: Deepseek; Concerns and facts