Article 6B1ZH LLaVA: Multimodales offenes KI-Modell auf LLaMA-Basis liest Bilder und Sprache

LLaVA: Multimodales offenes KI-Modell auf LLaMA-Basis liest Bilder und Sprache

from heise online News on 2023-04-22 10:15 (#6B1ZH)

Die Forschungsdemo des Large Language and Vision Assistant erlaubt Usern das Hochladen eigener Bilder zum Testen multimodaler Fahigkeiten und sammelt Feedback.

External Content

Source	RSS or Atom Feed
Feed Location	http://www.heise.de/newsticker/heise.rdf
Feed Title	heise online News
Feed Link	https://www.heise.de/

0 comments