llava

Collected description

Large Language and Vision Assistant. Enables visual instruction tuning and image-based conversations. Combines CLIP vision encoder with Vicuna/LLaMA language models. Supports multi-turn image chat, visual question answering, and instruct...

Source coverage

Total: 1
ClawHub: 0
Hermes: 1
GitHub: 0

Source details

hermes_hub

Large Language and Vision Assistant. Enables visual instruction tuning and image-based conversations. Combines CLIP vision encoder with Vicuna/LLaMA language models. Supports multi-turn image chat, visual question answering, and instruct...

Open source

Index metadata

Category: mlops

Static data

Detail JSON: Open detail JSON
Timeseries JSON: Open timeseries JSON