Stable Diffusion은 다음과 같은 AI 이미지 생성기에 대한 오픈 소스 대안입니다. 중간 여정 그리고 DALL-E다음으로 업데이트되었습니다. 버전 3.5. 새로운 모델은 널리 퍼져 있는 Stable Diffusion 3 Medium의 일부 잘못(과소평가되었을 수 있음)을 바로잡으려고 시도합니다. Stability AI는 3.5 모델이 다른 이미지 생성기보다 프롬프트를 더 잘 준수하고 출력 품질에서 훨씬 더 큰 모델과 경쟁한다고 말합니다. 또한 명시적으로 메시지를 표시할 필요 없이 더욱 다양한 스타일, 피부색 및 기능에 맞게 조정되었습니다.
새로운 모델은 세 가지 맛으로 제공됩니다. Stable Diffusion 3.5 Large는 트리오 중 가장 강력하며 최고 품질을 제공하는 동시에 신속한 준수로 업계를 선도합니다. Stability AI는 이 모델이 1MP 해상도에서 전문적인 용도에 적합하다고 말합니다.
한편 Stable Diffusion 3.5 Large Turbo는 더 큰 모델의 “증류” 버전으로 최대 품질보다 효율성에 더 중점을 둡니다. Stability AI는 Turbo 변형이 여전히 4단계를 거쳐 “뛰어난 신속한 준수로 고품질 이미지”를 생성한다고 말합니다.
마지막으로 Stable Diffusion 3.5 Medium(25억 매개변수)은 소비자 하드웨어에서 실행되도록 설계되어 품질과 단순성의 균형을 유지합니다. 더욱 쉽게 사용자 정의할 수 있으므로 이 모델은 0.25~2메가픽셀 해상도 사이의 이미지를 생성할 수 있습니다. 그러나 현재 출시된 처음 두 모델과 달리 Stable Diffusion 3.5 Medium은 10월 29일까지 출시되지 않습니다.
새로운 트리오는 실패한 것을 쫓는다 안정확산 3 매질 6월에. 회사는 이번 출시가 “우리 표준이나 커뮤니티의 기대를 완전히 충족하지 못했다”고 인정했습니다. 웃기게 그로테스크한 신체 공포 그런 것을 요구하지 않는 프롬프트에 응답하여. 오늘 발표에서 Stability AI가 예외적으로 신속한 준수를 반복적으로 언급한 것은 우연이 아닐 가능성이 높습니다.
Stability AI는 발표 블로그 게시물에서 간략하게만 언급했지만 3.5 시리즈에는 인간의 다양성을 더 잘 반영하는 새로운 필터가 있습니다. 회사는 새 모델의 인간 출력이 “광범위한 프롬프트가 필요 없이 다양한 피부색과 특징을 가진 한 유형의 사람이 아니라 세계를 대표하는 것”이라고 설명합니다.
올해 초 Google의 대실패와는 달리 미묘함과 역사적 민감성을 설명할 수 있을 만큼 정교하기를 바랍니다. 그렇게 하라는 요청도 없이 Gemini는 다음과 같이 매우 부정확한 역사적 “사진” 컬렉션을 제작했습니다. 인종적으로 다양한 나치와 미국 건국의 아버지. 반발이 너무 심해서 구글은 인간 세대를 다시 통합하지 않았다. 6개월 후까지.