多模态模型可以融合多少模态?Apple:≥ 21
图像 Token 化:视觉数据转换的关键技术