Des entreprises comme Stitch Fix expérimentent déjà DALL-E 2 – Métaverse Marketing

Cela fait à peine quelques semaines qu’OpenAI a commencé à permettre aux clients d’utiliser commercialement des images créées par DALL-E 2, son système de synthèse d’image par IA remarquablement puissant. Mais malgré les limitations techniques actuelles et le manque de licences en volume, sans parler de l’API, certains pionniers disent qu’ils testent déjà le système pour divers cas d’utilisation commerciale – en attendant le jour où DALL-E 2 deviendra suffisamment stable pour être déployé en production. .

Stitch Fix, le service en ligne qui utilise des algorithmes de recommandation pour personnaliser les vêtements, affirme avoir expérimenté avec DALL-2 pour visualiser ses produits en fonction de caractéristiques spécifiques telles que la couleur, le tissu et le style. Par exemple, si un client de Stitch Fix demandait un « jean taille haute, rouge, extensible et skinny » pendant le projet pilote, DALL-E 2 était exploité pour générer des images de cet article, qu’un styliste pourrait utiliser pour faire correspondre avec un similaire produit dans l’inventaire de Stitch Fix.

« DALL-E 2 nous aide à mettre en évidence les caractéristiques les plus informatives d’un produit de manière visuelle, aidant finalement les stylistes à trouver l’article parfait qui correspond à ce qu’un client a demandé dans ses commentaires écrits », a déclaré un porte-parole à Métaverse Marketing par e-mail.

Point fixe DALL-E 2

Une génération DALL-E 2 du pilote de Stitch Fix. L’invite était : « doux, vert olive, belle couleur, poches, motifs, texture mignonne, long, cardigan. »

Bien sûr, DALL-E 2 a des bizarreries, dont certaines font réfléchir les premiers utilisateurs en entreprise. Eric Silberstein, vice-président de la science des données chez la startup de commerce électronique Klaviyo, décrit dans un article de blog ses impressions mitigées sur le système en tant qu’outil de Métaverse Marketing potentiel.

Il note que les expressions faciales sur les modèles humains générés par DALL-E 2 ont tendance à être inappropriées et que les muscles et les articulations sont disproportionnés, et que le système ne comprend pas toujours parfaitement les instructions. Lorsque Silberstein a demandé à DALL-E 2 de créer une image d’une bougie sur une table en bois sur un fond gris, DALL-E 2 a parfois effacé le couvercle de la bougie et l’a fondu dans le bureau, ou a ajouté un rebord incongru autour de la bougie.

DALL-E 2 Eric Silberstein

Expériences de Silberstein avec DALL-E 2 pour la visualisation de produits.

« Pour les photos avec des humains et les photos de produits de modélisation d’humains, il ne pouvait pas être utilisé tel quel », a écrit Silberstein. Pourtant, il a dit qu’il envisagerait d’utiliser DALL-E 2 pour des tâches telles que donner des points de départ pour les modifications et transmettre des idées aux graphistes. « Pour les photos d’archives sans humains et les illustrations sans directives de marque spécifiques, DALL·E 2, à mon œil de non-expert, pourrait raisonnablement remplacer « l’ancienne méthode » en ce moment », a poursuivi Silberstein.

Lire Plus  Tesla veut votre vote pour les nouveaux emplacements Supercharger • Metaverse Marketing

Les éditeurs de Cosmopolitan sont arrivés à un point similaire conclusion lorsqu’ils se sont associés à l’artiste numérique Karen X. Cheng pour créer une couverture pour le magazine à l’aide de DALL-E 2. L’arrivée à la couverture finale a nécessité une incitation très spécifique de Cheng, ce qui, selon les éditeurs, est illustratif de la limitation de DALL-E 2 en tant que générateur d’art.

Mais l’étrangeté de l’IA fonctionne parfois – comme une fonctionnalité plutôt que comme un bug. Pour son Draw Ketchup campagne, Heinz a demandé à DALL-E 2 de générer une série d’images de bouteilles de ketchup en utilisant des termes en langage naturel tels que « ketchup », « art du ketchup », « ketchup flou », « ketchup dans l’espace » et «  »renaissance du ketchup ». La société a invité les fans à envoyer leurs propres invites, que Heinz a organisées et partagées sur ses réseaux sociaux.

Heinz DALL-E 2

Les bouteilles Heinz « imaginées » par DALL-E 2, dans le cadre de la récente campagne publicitaire de Heinz.

« Avec l’imagerie de l’IA qui domine les actualités et les flux sociaux, nous avons vu une opportunité naturelle d’étendre notre campagne « Draw Ketchup » ; enraciné dans l’idée que Heinz est synonyme du mot ketchup – pour tester cette théorie dans l’espace de l’IA », a déclaré Jacqueline Chao, responsable principale de la marque Heinz, dans un communiqué de presse.

De toute évidence, les campagnes basées sur DALL-E 2 peuvent fonctionner lorsque l’IA est le sujet. Mais plusieurs utilisateurs professionnels de DALL-E 2 disent avoir utilisé le système pour générer des actifs qui ne portent pas les signes révélateurs des contraintes de l’IA.

Lire Plus  Ford conclut un accord sur l'énergie solaire avec DTE Energy – Métaverse Marketing

Jacob Martin, un ingénieur logiciel, a utilisé DALL-E 2 pour créer un logo pour OctoSQL, un projet open source qu’il développe. Pour environ 30 $ – à peu près le coût de services de création de logo sur Fiverr – Martin s’est retrouvé avec une image de dessin animé d’une pieuvre qui ressemble à une illustration humaine à l’œil nu.

« Le résultat final n’est pas idéal, mais j’en suis très content », a écrit Martin dans un article de blog. « En ce qui concerne DALL-E 2, je pense qu’en ce moment, il est encore dans une phase de » première itération « pour la plupart des éléments et des objectifs – la principale exception étant les croquis au crayon; ceux-ci sont incroyablement bons… Je pense que la véritable percée viendra lorsque DALL-E 2 sera 10 à 100 fois moins cher et plus rapide.

DALL-E 2 OctoSQL

Le logo OctoSQL, généré après plusieurs tentatives avec DALL-E 2.

Un utilisateur de DALL-E 2, Don McKenzie, responsable de la conception de la startup de développement Deephaven, a poussé l’idée un peu plus loin. Il a testé l’application du système pour générer des vignettes sur le blog de l’entreprise, motivé par le idée que les messages avec des images obtiennent beaucoup plus d’engagement que ceux sans.

« En tant que petite équipe composée principalement d’ingénieurs, nous n’avons ni le temps ni le budget pour commander des illustrations personnalisées pour chacun de nos articles de blog », a écrit McKenzie dans un article de blog. « Jusqu’à présent, notre approche a consisté à passer 10 minutes à faire défiler des images tangentiellement liées mais finalement mal adaptées à partir de sites de photos, à télécharger quelque chose de pas terrible, à le mettre en avant et à publier. »

Lire Plus  Le propriétaire de Tesla Model 3 demande un recours collectif contre le «freinage fantôme» – Metaverse Marketing

Après avoir passé un week-end et 45 $ en crédits, McKenzie dit qu’il a pu remplacer une centaine d’articles de blog par des images générées par DALL-E 2. Il a fallu tâtonner avec les invites pour obtenir les meilleurs résultats, mais McKenzie dit que cela en valait la peine.

« En moyenne, je dirais qu’il a fallu quelques minutes et environ quatre à cinq invites par article de blog pour obtenir quelque chose dont j’étais satisfait », a-t-il écrit. « Nous dépensions plus d’argent et de temps sur les images de stock par mois, avec un résultat pire. »

Pour les entreprises qui n’ont pas le temps de passer à des invites de brainstorming, il existe déjà une startup qui essaie de commercialiser les capacités de génération d’actifs de DALL-E 2. Unstock.ai, construit sur DALL-E 2, promet « des images et des illustrations de haute qualité à la demande » – sans frais, pour le moment. Les clients entrent une invite (par exemple, « Vue de dessus de trois poissons rouges dans un bocal »), puis choisissent un style préféré (art vectoriel, photoréaliste, crayonné) pour créer des images, qui peuvent être recadrées et redimensionnées.

Unstock.ai automatise essentiellement l’ingénierie rapide, un concept de l’IA qui cherche à intégrer une description de tâche dans le texte. L’idée est de fournir à un système d’IA des instructions détaillées afin qu’il accomplisse de manière fiable la chose qui lui est demandée ; En général, les résultats d’une invite telle que « Image fixe d’une femme buvant du café, se rendant au travail à pied, téléobjectif » seront beaucoup plus cohérents que « Une femme qui marche ».

C’est probablement un signe avant-coureur d’applications à venir. Lorsqu’il a été contacté pour un commentaire, OpenAI a refusé de partager les chiffres concernant les utilisateurs professionnels de DALL-E 2. Mais pour l’anecdote, la demande semble être là. Des solutions de contournement non officielles au manque d’API de DALL-E 2 ont vu le jour sur le Web, enchaînées par des développeurs désireux d’intégrer le système dans des applications, des services, des sites Web et même jeux vidéos.