🦙LLaMA 3 掀桌子三部曲(二):LLaMA 3.1 发布技术分享LLaMA 3.1 发布,开源了 405B 的旗舰模型,效果达到闭源的 SOTA 🔥🔥🔥。新模型带来了工具调用、更好地支持多语言等功能。2024-7-25 LLM GPT4 Generative NLP 大语言模型 ChatGPT Meta LLaMA3 LLaMA3.1 多模态模型 GPT-4o VLM
🏞️多模态模型可以融合多少模态?Apple:≥ 21技术分享Apple 的 4M 项目通过创新的多模态融合技术,成功将 21 种不同类型的数据模态嵌入统一的模型框架中,实现了跨模态检索、生成和编辑等任务。2024-7-6 MML 多模态模型 多模态学习 ImageBind 4M Apple Meta Multimodal Learning MaskGIT Transformer
🦙LLaMA 3 掀桌子三部曲(一):LLaMA 3 发布技术分享LLaMA 3 又来掀桌子了,发布一天后排名已经到开源模型首位了,已超过早期的 GPT4 和 Gemini Pro 🔥🔥🔥。哪些因素带来了新的精度提升?2024-4-19 LLM GPT4 Generative NLP 大语言模型 ChatGPT Meta LLaMA3
Meta的版面恢复大模型:Nougat 开源工具详细介绍 Meta 刚刚开源的版面恢复大模型 Nougat(牛轧糖),并与我的版面恢复开源小工具 Pix2Text (P2T) 做了对比。2023-9-4 版面恢复 数学公式检测 数学公式识别 LaTeX OCR Nougat Pix2Text P2T Meta VIE Layout-Analysis Layout-Recovery