Pipeline multimodal unificado
Entradas de texto, imagem e vídeo de referência fluem por um único orquestrador no servidor que escolhe o modelo fundacional certo para cada cena, normaliza parâmetros entre provedores e retorna um formato de saída consistente. Você escreve um prompt; nós cuidamos da seleção de modelo, adaptação de proporção e sincronização de áudio.