Хиймэл оюуны “СПУТНИК”-ийн талаарх тойм
Хиймэл оюуны “СПУТНИК”-ийн талаарх тойм

Хятадын технологийн стартап DeepSeek-ийн бүтээсэн хиймэл оюун ухаантай чатботтой холбоотой мэдээ хөрөнгийн зах зээлийг хөөрөгдөж, хиймэл оюун ухааны технологийг хөгжүүлэхэд АНУ, Хятадын эдийн засаг, геополитикийн өрсөлдөөний талаарх маргааныг өдөөсөн юм. Түүнчлэн “Deepseek R1 бол хиймэл оюун ухааны Спутник мөч юм” гэж хөрөнгө оруулагч Марк Андреессен X платформ дээрээ нийтлэн Зөвлөлт Холбоот Улс, АНУ-ын хоорондын Хүйтэн дайны үеийн сансрын хайгуулын уралдааныг эхлүүлсэн 1957 оны хиймэл дагуул хөөргөлтийн тухай дурдсан.

DeepSeek стартап нь 2023 онд БНХАУ-ын Ханжоу хотод үүсгэн байгуулагдсан бөгөөд гүйцэтгэх захирал Лиан Вэнфэн өмнө нь хиймэл оюунд суурилсан арилжаан дээр илүү төвлөрдөг Хятадын шилдэг сангуудын нэг болох High-Flyer-ийг үүсгэн байгуулж байжээ. R1 нь тэдний гаргасан анхны модел биш бөгөөд 2023 оны сүүлээр анхны хиймэл оюуны хэлний загвараа гаргасан ба Deepseek-V1, V2 гэх мэт моделиудын зэрэгцээ судалгааны өгүүллүүд нийтлүүлж байжээ.

Deepseek-R1 нь эргэцүүлж тунгаан боддог, логик дэс дараалалтай алхмуудыг хийж өгөгдсөн асуулт, асуудалд хариулт, шийдлийг өгдөг хиймэл оюуны загвар ба OpenAI-ийн GPT-4o болон o1 зэрэг орчин үеийн бусад том хэлний загваруудтай дүйцэхүйц зарим талаараа бага зэрэг илүү хариултуудыг өгч байна. Ерөнхий болон математикийн асуудал шийдэх чадвар, өргөн хүрээний мэдлэгийн болон кодчиллын чадваруудын харьцуулалтыг дараах зургаас харж болно.

Мэдээллийн зураг:

Open-AI-ийн моделиуд, Google-ийн Gemini гэх мэт бусад моделиудаас ялгаатай нь:
 1.  Deepseek-R1 нь нээлттэй эхийн модель бөгөөд энэ нь тус моделийн эхийг хэн ч үзэх, өөрчлөх, түгээн чөлөөтэй ашиглах боломжтой гэсэн үг юм. Энэ нь хөгжүүлэгчид, судлаачид болон оюутнууд гэх мэт хэн бүхэнд ямар ч хязгаарлалтгүйгээр тус технологийг сайжруулан, өөр өөр хэрэгцээ шаардлагад тохируулан өөрчлөх боломжийг олгож байгаа юм.

  1. Энэхүү моделийг сургах зардал бага болсон хэмээн Deepseek компани зарласан бөгөөд ойролцоогоор 6 сая ам долларын өртөгтэйгөөр бүтсэн нь OpenAI компанийн гаргасан 100 сая — 1 тэрбум ам долларын үнэтэй моделиудтай харьцуулахад маш бага байгаа юм.
  2. 3. Хүртээмжтэй байх үүднээс загварын хэмжээг багасган сургах (Gemini мөн адил ийм давуу талтай). Deepseek-R1 нь 671 тэрбум параметртэй ба үүнийг ажиллуулахын тулд олон мянган GPU, зөвхөн технологийн аварга компаниудын төлж чадах тийм дэд бүтцийг шаардлагатай болно. Distillition буюу нэрэх сургалт нь том загварын шахан, чадваруудыг жижиг загварт шингээх үйл явцыг бөгөөд энэ нь хиймэл оюуныг илүү хүртээмжтэй болгох юм. DeepSeek-ийн судлаачид өөрсдийн загварыг Llama 3 болон Qwen гэх жижиг загварууд руу нэрэн туршсан ба тэдгээр жижиг загварууд нь зарим тохиолдолд анхны загвараасаа илүү сайн ажиллажээ.

Deepseek-R1 модель нь 2024 оны 12 сард гарсан Deepseek-V3 гэх 671 параметртэй том хэлний модель дээр суурилан, V3-ийн тексттэй ажиллах чадварыг илүү сайжруулж эргэцүүлэн бодох чадвартай болгоход төвлөрсөн ба V3-ийн адилаар нэмэлт өөрчлөлт оруулсан Transformer архитектурыг ашигласан.
Эхний ээлжид Group Relative Policy Optimization (GRPO) гэх reinforcement аргыг ашиглан Deepseek-R1-Zero моделийг сургасан ба хэдийгээр тус модель тодорхой түвшинд сайн байсан боловч хариулах явцдаа хэл солих болон уншихад төвөгтэй байх гэсэн асуудлуудтай байсан тул дахин аргаа шинэчлэн Deepseek-R1 -ийг сургасан байна.
Ингэхдээ өндөр чанартай, шошгологдсон 800000 “cold-start” өгөгдлийг цуглуулан, reinforcement аргыг хэрэгжүүлэхийн өмнө Supervised Fine-Tuning (SFT)-ийг ашигласан нь амжилттай болсон юм.

Саяхан OpenAI компани ChatGPT-ийн шинэхэн функцийг зарласан нь Deepseek-ийн R1 моделийн хариу гэлтэй. Томоохон компаниудын өрсөлдөөн цаашид хэрхэн үргэлжлэх нь улам бүр сонирхолтой болох биз ээ.


Эх сурвалж

  1. https://en.wikipedia.org/wiki/DeepSeek
  2. https://www.deepseek.com/
  3. https://www.youtube.com/watch?v=pE_kCcY9Qbg
  4. https://github.com/deepseek-ai/DeepSeek-V3/tree/main
  5. https://medium.com/@tahirbalarabe2/deepseek-r1-explained-chain-of-thought-reinforcement-learning-and-model-distillation-0eb165d928c9
  6. https://www.youtube.com/watch?v=QdEuh2UVbu0
  7. https://www.youtube.com/watch?v=fTjPEE0fk-U&t=4s
  8. https://github.com/deepseek-ai/DeepSeek-R1/tree/main
  9. https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf
  10. https://news.mn/r/2780435/?fbclid=IwY2xjawIVzRFleHRuA2FlbQIxMQABHWtXDus4dTeTJLnIHEOLm_KSgIqc1Oe_1SX0V3jFLmu-_VBkM2dfB8_nXQ_aem_bTrj3tpK5BcSSzke3BSugg
  11. https://www.bbc.com/news/articles/c5yv5976z9po
  12. https://www.geeksforgeeks.org/deepseek-r1-vs-deepseek-v3/
Нийтлэл бичсэн: М. Минжинсор


Бусад мэдээлэл