DeepSeek освобождава V3.2-EXP експериментален модел, намалява цените на API с над 50% · Technode
DeepSeek стартира и е отворен DeepSeek-V3.2-EXP, експериментален модел с голям език, разположен като стъпка към своята архитектура от следващото поколение. Моделът въвежда Deepseek рядко внимание, финозърнест механизъм за рядко внимание, предназначен да подобри ефективността в обучението и извода с дълъг текст, като същевременно поддържа качеството на изхода. Сравнен спрямо предишния модел V3.1-края при подравнени настройки…









