DeepSeek разкрива AI модел за домашни чипове в символично прекъсване на зависимостта от Nvidia

Китайският стартъп за изкуствен интелект DeepSeek пусна в петък ново поколение големи езикови модели, изрично настроени за домашни чипове, крайъгълен камък, разглеждан от експертите в индустрията като промяна от зависимостта от Nvidia.

Компанията представи предварителен преглед на своята серия DeepSeek-V4, заедно с високопроизводителна Pro версия и олекотен Flash вариант.

Трябва да се отбележи, че в техническия си доклад DeepSeek за първи път постави както Nvidia Graphics Processing Units, или GPU, така и Huawei Ascend Neural Processing Unit, или NPU, в рамките на една и съща рамка за валидиране на хардуер, отбелязвайки, че неговата фина експертна паралелна схема е проверена и в двете платформи.

DeepSeek каза, че моделът V4 поддържа ултра-дълги контекстни прозорци с до един милион китайски символа и предоставя подобрения в способностите на агентите, световното познание и производителността на разсъжденията – ключови показатели при оценката на AI от следващо поколение.

Този ход нарушава дългогодишния модел, при който китайските разработчици са разчитали почти изключително на екосистемата Compute Unified Device Architecture на Nvidia или CUDA за обучение и изводи.

DeepSeek добави, че моделът V4 вече е завършил адаптирането на извода на платформата Ascend на Huawei, което показва, че внедряването на домашни чипове преминава от експериментално тестване към практическо внедряване.

Промяната идва на фона на затягането на контрола върху износа на модерни полупроводници от Съединените щати, което ускори стремежа на Китай да изгради самодостатъчен AI стек, обхващащ чипове, рамки и модели.

Същия ден Пекинската академия за изкуствен интелект каза, че нейната система FlagOS вече е адаптирала DeepSeek-V4-Flash за пълно внедряване на изводи в повече от осем архитектури на AI чипове, включително тези от Huawei, Hygon и Moore Threads.

Нашия източник е Българо-Китайска Търговско-промишлена палaта

Related Posts