Pesquisadores introduziram Modelos de Dualidade (DuMo), uma abordagem inovadora para modelos generativos baseados em consistência, que promete melhorar a estabilidade e eficiência desses sistemas. De acordo com informações do arXiv, o DuMo utiliza um paradigma de “uma entrada, duas saídas”, permitindo a previsão simultânea de velocidade e mapa de fluxo a partir de um único input.
Como os Modelos de Dualidade funcionam?
Os modelos tradicionais, como Shortcut e MeanFlow, enfrentam limitações devido à separação dos objetivos de treinamento, o que pode prejudicar a convergência e escalabilidade. No entanto, o DuMo aplica restrições geométricas do objetivo de múltiplos passos a cada amostra, melhorando a estimativa de poucos passos sem separar os objetivos de treinamento. Isso resulta em uma melhoria significativa na estabilidade e eficiência.
Quais são os resultados obtidos com o DuMo?
Nos testes realizados no ImageNet 256 × 256, um Diffusion Transformer de 679 milhões de parâmetros com SD-VAE alcançou um FID de 1,79 em apenas dois passos, estabelecendo um novo estado da arte. Este avanço demonstra o potencial do DuMo em superar as limitações dos métodos anteriores.
Qual é o impacto do DuMo na pesquisa de modelos generativos?
O desenvolvimento do DuMo representa um passo significativo na pesquisa de modelos generativos, oferecendo uma solução para o dilema entre estabilidade e eficiência. Ao integrar objetivos de treinamento sem separação, o DuMo possibilita um treinamento mais robusto e eficaz, abrindo caminho para novas aplicações e avanços na área.
Fonte original: arXiv

