Хятадын технологийн стартап DeepSeek-ийн бүтээсэн хиймэл оюун ухаантай чатботтой холбоотой мэдээ хөрөнгийн зах зээлийг хөөрөгдөж, хиймэл оюун ухааны технологийг хөгжүүлэхэд АНУ, Хятадын эдийн засаг, геополитикийн өрсөлдөөний талаарх маргааныг өдөөсөн юм. Түүнчлэн “Deepseek R1 бол хиймэл оюун ухааны Спутник мөч юм” гэж хөрөнгө оруулагч Марк Андреессен X платформ дээрээ нийтлэн Зөвлөлт Холбоот Улс, АНУ-ын хоорондын Хүйтэн дайны үеийн сансрын хайгуулын уралдааныг эхлүүлсэн 1957 оны хиймэл дагуул хөөргөлтийн тухай дурдсан.
DeepSeek стартап нь 2023 онд БНХАУ-ын Ханжоу хотод үүсгэн байгуулагдсан бөгөөд гүйцэтгэх захирал Лиан Вэнфэн өмнө нь хиймэл оюунд суурилсан арилжаан дээр илүү төвлөрдөг Хятадын шилдэг сангуудын нэг болох High-Flyer-ийг үүсгэн байгуулж байжээ. R1 нь тэдний гаргасан анхны модел биш бөгөөд 2023 оны сүүлээр анхны хиймэл оюуны хэлний загвараа гаргасан ба Deepseek-V1, V2 гэх мэт моделиудын зэрэгцээ судалгааны өгүүллүүд нийтлүүлж байжээ.
Deepseek-R1 нь эргэцүүлж тунгаан боддог, логик дэс дараалалтай алхмуудыг хийж өгөгдсөн асуулт, асуудалд хариулт, шийдлийг өгдөг хиймэл оюуны загвар ба OpenAI-ийн GPT-4o болон o1 зэрэг орчин үеийн бусад том хэлний загваруудтай дүйцэхүйц зарим талаараа бага зэрэг илүү хариултуудыг өгч байна. Ерөнхий болон математикийн асуудал шийдэх чадвар, өргөн хүрээний мэдлэгийн болон кодчиллын чадваруудын харьцуулалтыг дараах зургаас харж болно.
Мэдээллийн зураг:
Open-AI-ийн моделиуд, Google-ийн Gemini гэх мэт бусад моделиудаас ялгаатай нь:
1. Deepseek-R1 нь нээлттэй эхийн модель бөгөөд энэ нь тус моделийн эхийг хэн ч үзэх, өөрчлөх, түгээн чөлөөтэй ашиглах боломжтой гэсэн үг юм. Энэ нь хөгжүүлэгчид, судлаачид болон оюутнууд гэх мэт хэн бүхэнд ямар ч хязгаарлалтгүйгээр тус технологийг сайжруулан, өөр өөр хэрэгцээ шаардлагад тохируулан өөрчлөх боломжийг олгож байгаа юм.
Deepseek-R1 модель нь 2024 оны 12 сард гарсан Deepseek-V3 гэх 671 параметртэй том хэлний модель дээр суурилан, V3-ийн тексттэй ажиллах чадварыг илүү сайжруулж эргэцүүлэн бодох чадвартай болгоход төвлөрсөн ба V3-ийн адилаар нэмэлт өөрчлөлт оруулсан Transformer архитектурыг ашигласан.
Эхний ээлжид Group Relative Policy Optimization (GRPO) гэх reinforcement аргыг ашиглан Deepseek-R1-Zero моделийг сургасан ба хэдийгээр тус модель тодорхой түвшинд сайн байсан боловч хариулах явцдаа хэл солих болон уншихад төвөгтэй байх гэсэн асуудлуудтай байсан тул дахин аргаа шинэчлэн Deepseek-R1 -ийг сургасан байна.
Ингэхдээ өндөр чанартай, шошгологдсон 800000 “cold-start” өгөгдлийг цуглуулан, reinforcement аргыг хэрэгжүүлэхийн өмнө Supervised Fine-Tuning (SFT)-ийг ашигласан нь амжилттай болсон юм.
Саяхан OpenAI компани ChatGPT-ийн шинэхэн функцийг зарласан нь Deepseek-ийн R1 моделийн хариу гэлтэй. Томоохон компаниудын өрсөлдөөн цаашид хэрхэн үргэлжлэх нь улам бүр сонирхолтой болох биз ээ.
Эх сурвалж