Tencent Open-Sources HunyuanOCR, олекотен търговски модел на визия
ШЕНЖЕН – Големият моделен екип на Tencent Hunyuan официално пусна HunyuanOCR с отворен код, специализиран лек визуален езиков модел за оптично разпознаване на символи (OCR), съдържащ само 1 милиард параметъра. Моделът съчетава естествена архитектура на Vision Transformer (ViT) с олекотен голям езиков модел (LLM), осигурявайки производителност на комерсиално ниво при откриване на текст, парсиране на…
Tencent Open-Sources HunyuanOCR, олекотен търговски модел на визия Read More »









