Traduction de texte demandée

Anonymous

Cliquez sur l'invite, puis entrez votre texte.

Traduc Automation logo
Traduc Automation

Je suis prêt à recevoir votre texte pour la traduction. Veuillez entrer le texte que vous souhaitez que je traduise.

Anonymous

Abstract We show that prompt following abilities of text-to-image models can be sub- stantially improved by training on highly descriptive generated image captions. Existing text-to-image models struggle to follow detailed image descriptions and often ignore words or confuse the meaning of prompts. We hypothesize that this issue stems from noisy and inaccurate image captions in the training dataset. We address this by training a bespoke image captioner and use it to recaption the training dataset. We then train several text-to-image models and find that training on these synthetic captions reliably improves prompt following ability. Finally, we use these findings to build DALL-E 3: a new text-to-image generation system, and benchmark its performance on an evaluation designed to measure prompt following, coherence, and aesthetics, finding that it compares favorably to competitors. We publish samples and code for these evaluations so that future research can continue optimizing this important aspect of text-to-image systems.

Traduc Automation logo
Traduc Automation

La langue identifiée est : anglais.

Le type de langage détecté est : scientifique.

Veuillez choisir une langue de traduction parmi l'allemand, l'anglais, l'espagnol ou le français.

Anonymous

Français

Traduc Automation logo
Traduc Automation

Traduction du texte de l'anglais vers le français :

Résumé Nous démontrons que les capacités des modèles de génération d'images à partir de textes à suivre les instructions peuvent être considérablement améliorées en les entraînant sur des légendes d'images générées très descriptives. Les modèles de texte vers image actuels peinent à suivre des descriptions d'images détaillées et ignorent souvent des mots ou confondent le sens des instructions. Nous supposons que ce problème provient des légendes d'images bruyantes et inexactes dans le jeu de données d'entraînement. Nous abordons ce problème en entraînant un légendeur d'images sur mesure et en l'utilisant pour re-légender le jeu de données d'entraînement. Nous entraînons ensuite plusieurs modèles de texte vers image et constatons que l'entraînement sur ces légendes synthétiques améliore de manière fiable la capacité à suivre les instructions. Enfin, nous utilisons ces découvertes pour construire DALL-E 3 : un nouveau système de génération d'images à partir de textes, et évaluons ses performances sur un test conçu pour mesurer la capacité à suivre les instructions, la cohérence et l'esthétique, constatant qu'il se compare favorablement à ses concurrents. Nous publions des échantillons et du code pour ces évaluations afin que la recherche future puisse continuer à optimiser cet aspect important des systèmes de texte vers image.

Voulez-vous que je traduise un autre texte ? Répondez par oui ou non.

Anonymous

oui

Traduc Automation logo
Traduc Automation

Parfait ! Veuillez entrer le texte que vous souhaitez que je traduise.

Anonymous

Abstract We show that prompt following abilities of text-to-image models can be sub- stantially improved by training on highly descriptive generated image captions. Existing text-to-image models struggle to follow detailed image descriptions and often ignore words or confuse the meaning of prompts. We hypothesize that this issue stems from noisy and inaccurate image captions in the training dataset. We address this by training a bespoke image captioner and use it to recaption the training dataset. We then train several text-to-image models and find that training on these synthetic captions reliably improves prompt following ability. Finally, we use these findings to build DALL-E 3: a new text-to-image generation system, and benchmark its performance on an evaluation designed to measure prompt following, coherence, and aesthetics, finding that it compares favorably to competitors. We publish samples and code for these evaluations so that future research can continue optimizing this important aspect of text-to-image systems.

Traduc Automation logo
Traduc Automation

La langue identifiée est : anglais.

Le type de langage détecté est : scientifique.

Veuillez choisir une langue de traduction parmi l'allemand, l'anglais, l'espagnol ou le français.

Anonymous

Allemand

Traduc Automation logo
Traduc Automation

Traduction du texte de l'anglais vers l'allemand :

Zusammenfassung Wir zeigen, dass die Fähigkeit von Text-zu-Bild-Modellen, Anweisungen zu folgen, durch das Training mit hochbeschreibenden generierten Bildunterschriften erheblich verbessert werden kann. Bestehende Text-zu-Bild-Modelle haben Schwierigkeiten, detaillierte Bildbeschreibungen zu folgen und ignorieren oft Wörter oder verwechseln die Bedeutung von Anweisungen. Wir vermuten, dass dieses Problem von lärmenden und ungenauen Bildunterschriften im Trainingsdatensatz herrührt. Wir begegnen diesem Problem, indem wir einen maßgeschneiderten Bildunterschrifter trainieren und ihn verwenden, um den Trainingsdatensatz neu zu beschriften. Anschließend trainieren wir mehrere Text-zu-Bild-Modelle und stellen fest, dass das Training mit diesen synthetischen Unterschriften die Fähigkeit, Anweisungen zu folgen, zuverlässig verbessert. Schließlich nutzen wir diese Erkenntnisse, um DALL-E 3 zu entwickeln: ein neues Text-zu-Bild-Generierungssystem, und bewerten seine Leistung anhand einer Bewertung, die darauf ausgelegt ist, die Fähigkeit zur Befolgung von Anweisungen, Kohärenz und Ästhetik zu messen, wobei wir feststellen, dass es im Vergleich zu Konkurrenten gut abschneidet. Wir veröffentlichen Proben und Code für diese Bewertungen, damit die zukünftige Forschung diesen wichtigen Aspekt von Text-zu-Bild-Systemen weiter optimieren kann.

Voulez-vous que je traduise un autre texte ? Répondez par oui ou non.

Anonymous

Non

Traduc Automation logo
Traduc Automation

Très bien. Si vous avez besoin d'une autre traduction à l'avenir, n'hésitez pas à revenir. Bonne journée !