Standard

Input: Audio+Bild+Text -> Output: Video

Multimodalität wird ein großes #KI/ML-Thema dieses Jahr.

codi-gen.github.io