【AiBase提要】随着大模型的持续进步,许多玩家在讨论:AI会朝着什么方向发展?2024年AI行业会遇冷吗?或者迎来新的突破和更广泛的应用?监管者和公众将如何应对?
在2024年,我们将看到具有高分辨率和长期连贯性的视频生成。这将需要更多的“思考” ,即系统2的推理和长远规划。
比如一种沿着断层线的「慢地震」行为(预示地震到来的有用指标),以及地震噪声。
它不仅可以从图片中提取信息并回答问题,还可以将图片转化为JSON格式。LLaVA还可以识别验证码、识别图中的物体品种等,展现出了强大的多模态能力。在性能上接近GPT-4的情况下,LLaVA具有更高的成本效益,训练只需要8个A100即可在1天内完成。