


ByteDance пусна Lance, олекотен нативен унифициран мултимодален AI модел със само 3 милиарда активирани параметъра, според отчета на IT Home от 22 май.
За разлика от повечето съществуващи мултимодални подходи, които разделят „разбиране“ и „поколение“ в отделни модули и да ги съчетае заедно, Lance е проектиран от самото начало като унифицирана система, която обработва разбирането на изображения, разбирането на видео, генерирането на изображения, генерирането на видео и редактирането между модове в рамките на една архитектура от началото на обучението.
Моделът е с отворен код и е насочен към нарастващото търсене на ефективен мултимодален AI, който може да работи в различни видове медии, без да разчита на множество специализирани модели. Неговият компактен брой 3B параметри го позиционира за внедряване в крайни и потребителски хардуерни сценарии, където по-големите модели са непрактични.
Изданието следва продължаващата инвестиция на ByteDance в изследване на модела на основата, надграждайки предишни версии, включително Seedance. Lance е достъпен за изтегляне и внедряване чрез каналите с отворен код на компанията.
Единният подход на модела към мултимодалния AI представлява забележителен архитектурен избор в област, където повечето конкуренти използват хибридни тръбопроводи, комбиниращи отделни специализирани модели за различни задачи.
Source link
Like this:
Like Loading…
Нашия източник е Българо-Китайска Търговско-промишлена палaта


