DeepSeek ще пусне мултимодален модел V4 следващата седмица с естествена поддръжка за генериране на изображения, видео и текст

DeepSeek ще пусне мултимодален модел V4 следващата седмица с естествена поддръжка за генериране на изображения, видео и текст

На 28 февруари Financial Times публикува публикация в блог днес, в която съобщава, че DeepSeek ще пусне своя нов мултимодален голям езиков модел V4 следващата седмица, с вградена поддръжка за функции за генериране на изображения, видео и текст.

Това бележи първата голяма актуализация на версията на DeepSeek от пускането на модела за разсъждение R1 през януари 2025 г., като се очаква допълнително да запълни пазарното търсене на евтини модели с отворен код в Китай.

Когато пусне V4 следващата седмица, DeepSeek планира едновременно да публикува кратко техническо обяснение, с подробен инженерен доклад, който да последва около месец по-късно.

По отношение на хардуерната адаптация, източниците показват, че DeepSeek осигурява дълбока поддръжка за местната изчислителна мощност, като си партнира с Huawei и Cambricon за оптимизиране на хардуерната адаптация на модела V4, което се очаква значително да повиши вътрешното търсене на полупроводници и да ускори AI модела „умозаключение“ процеси, движещи се към домашни чипове.

Друга информация показва, че DeepSeek V4 дава приоритет на предоставянето на ранен достъп на местни доставчици, включително Huawei, без да предоставя тестови версии на NVIDIA и AMD, нарушавайки стандартните практики в индустрията. Разработчиците на AI обикновено споделят предварителни версии на основните модели с производители на чипове като NVIDIA и AMD, за да гарантират, че техният софтуер работи ефективно на широко използван хардуер, като DeepSeek преди това тясно си сътрудничи с техническия персонал на NVIDIA.

Според надеждни източници версията за предварителен преглед V4 с кодово име „sealion-lite“ навлезе в затворено вътрешно тестване, с контекстен прозорец, разширен до 1 милион токена, поддържащи първоначално мултимодални възможности за разсъждение за задълбочен анализ и разбиране на сложни входове, като изключително дълъг текст и големи кодови библиотеки. Предишна информация показва, че V4 може да бъде мега фундаментален модел с трилиони параметри.

Източник: IT Home

Source link

Like this:

Like Loading…

Нашия източник е Българо-Китайска Търговско-промишлена палaта

Scroll to Top