Article 6B1ZH LLaVA: Multimodales offenes KI-Modell auf LLaMA-Basis liest Bilder und Sprache

LLaVA: Multimodales offenes KI-Modell auf LLaMA-Basis liest Bilder und Sprache

by
from heise online News on (#6B1ZH)

Bildschirmfoto_2023-04-22_um_11-fee7a547

Die Forschungsdemo des Large Language and Vision Assistant erlaubt Usern das Hochladen eigener Bilder zum Testen multimodaler Fahigkeiten und sammelt Feedback.

External Content
Source RSS or Atom Feed
Feed Location http://www.heise.de/newsticker/heise.rdf
Feed Title heise online News
Feed Link https://www.heise.de/
Reply 0 comments