Vés al contingut

Stable Diffusion

De la Viquipèdia, l'enciclopèdia lliure
Aquesta és una versió anterior d'aquesta pàgina, de data 00:12, 30 oct 2022 amb l'última edició de Editantpv (discussió | contribucions). Pot tenir inexactituds o contingut no apropiat no present en la versió actual.
(dif.) ←la pròxima versió més antiga | vegeu la versió actual (dif.) | Versió més nova → (dif.)
Stable Diffusion
Modifica el valor a Wikidata
Tipusmodel de text a imatge, latent variable model (en) Tradueix, Models de difusió i model d'aprenentatge profund Modifica el valor a Wikidata
Versió inicial22 agost 2022 Modifica el valor a Wikidata
Versió estable
3.5 (23 octubre 2024) Modifica el valor a Wikidata
LlicènciaStability AI Community License (en) Tradueix
CreativeML Open RAIL-M (en) Tradueix Modifica el valor a Wikidata
EpònimModels de difusió Modifica el valor a Wikidata
Característiques tècniques
Sistema operatiuAny that support CUDA kernels
Escrit enPython Modifica el valor a Wikidata
Equip
Desenvolupador(s)CompVis group LMU Munich; Runway; Stability AI[1]
Més informació
Lloc webstability.ai… (anglès) Modifica el valor a Wikidata
Id. Subredditstablediffusion Modifica el valor a Wikidata

Stable Diffusion és un model d'aprenentatge profund de text a imatge llançat el 2022. S'utilitza principalment per generar imatges detallades condicionades a descripcions de text, tot i que també es pot aplicar a altres tasques com ara la restauració d'imatges, repintar i generar traduccions d'imatge a imatge guiades per una entrada de text. [3]

Stable Diffusion és un model de difusió latent, una varietat de xarxes neuronals generatives profundes desenvolupades pel grup CompVis de la LMU de Munic. El model ha estat llançat per una col·laboració de Stability AI, CompVis LMU i Runway amb el suport d'EleutherAI i LAION. [4][1] [5] L'octubre de 2022, Stability AI va recaptar 101 milions de dòlars en una ronda liderada per Lightspeed Ventures i Coatue. [6]

El codi i els pesos del model de Stable Diffusion són públics i es pot executar amb la majoria de maquinari de consum equipat amb una GPU modesta. Això va marcar una diferència dels models propietaris anteriors de text a imatge, com ara DALL-E i Midjourney, als quals només es podia accedir mitjançant serveis al núvol. [7]

  1. 1,0 1,1 Error de citació: Etiqueta <ref> no vàlida; no s'ha proporcionat text per les refs nomenades stable-diffusion-github
  2. RunwayML. «stable-diffusion-v1-5». Hugging Face.
  3. «Diffuse The Rest - a Hugging Face Space by huggingface». huggingface.co. Arxivat de l'original el 2022-09-05. [Consulta: 5 setembre 2022].
  4. Error de citació: Etiqueta <ref> no vàlida; no s'ha proporcionat text per les refs nomenades stable-diffusion-launch
  5. «Revolutionizing image generation by AI: Turning text into images». LMU Munich. [Consulta: 17 setembre 2022].
  6. Wiggers, Kyle. «Stability AI, the startup behind Stable Diffusion, raises $101M» (en anglès). Techcrunch. [Consulta: 17 octubre 2022].
  7. «The new killer app: Creating AI art will absolutely crush your PC». PCWorld. Arxivat de l'original el 2022-08-31. [Consulta: 31 agost 2022].