Bbabo NET

Bilim ve Teknoloji Haberler

Yandex, YandexART dağıtım sinir ağını 1.3 sürümüne güncelledi

Merhaba! Adım Evgeniy Lyapustin, bilgisayarla görme ekibinde kıdemli bir geliştiriciyim. Yandex Araştırma'daki meslektaşlarımızla birlikte YandexART difüzyon sinir ağını 1.3 sürümüne güncelledik.

Ana değişiklik, sinir ağının gizli yayılma teknolojisine geçmesidir. Ayrıca modelin eğitildiği veri seti 2,5 kat artırıldı. Bu sayede YandexART'ın yeni sürümü metin sorgularını daha iyi anlıyor ve daha gerçekçi görseller oluşturuyor.

Kullanıcıları artık 16:9, 4:3 veya 3:4 gibi farklı formatlarda görseller oluşturma olanağına sahip olan Masterpiece'de YandexART 1.3 zaten kullanılıyor. Daha sonra güncellenen sinir ağı diğer Yandex hizmetlerinde de kullanılmaya başlayacak.

Kademeli difüzyonla görüntü, çözünürlük arttıkça giderek iyileşir. Gizli difüzyon farklı çalışır. Sıkıştırılmış biçimde görüntü hakkında temel bilgileri içeren kompakt bir açıklama biçiminde görüntünün ara gizli temsilini oluşturur. Sinir ağı daha sonra kodu tek adımda tam yüksek çözünürlüklü bir görüntüye genişletir.

Gizli yayılma teknolojisi daha az bilgi işlem kaynağı tüketir ve daha gerçekçi grafikler oluşturmanıza olanak tanır. Bunu pratikte de gördük. Modelin iki versiyonunu en benzer koşullar altında eğittik: kademeli ve gizli. Ve eğitimin her aşamasında, kalite ve hız ölçümlerinde gizli olan kazandı.

Veri seti 330 milyon resim-metin çiftinden 850 milyon çiftin üzerine çıkarıldı. Modelin kullanıcı isteklerini daha iyi anlayabilmesi için üzerinde eğitim aldığı veri kümesine, sinir ağı tarafından oluşturulan görüntülerin daha ayrıntılı açıklamaları olan sentetik metinler eklendi. Aşağıdaki resimde sentetik metin örneğini görebilirsiniz.

Ayrıca YandexART'ın istemden daha fazla ayrıntıyı dikkate alması için yeni model bir değil iki metin kodlayıcı kullanıyor. Bunlardan ilki, resim-metin çiftlerini eşleştirme konusunda eğitilmiş olan önceki sürüm 1.2'deki kodlayıcımızdır.

İkincisi ise bizim için yeni, açık kaynak umt5_xxl'e dayanıyor. İlkinden farklı olarak bu kodlayıcı yalnızca metinler üzerinde eğitiliyordu. İki farklı kodlayıcı, farklı nitelikteki model sinyallerini verir.

Yandex değerlendiricilerinin SBS ölçümlerinin sonuçlarına göre, YandexART 1.3 sinir ağı, Midjourney V5.2'ye kıyasla vakaların yüzde 57'sinde ve YandexART 1.2'nin önceki sürümüne kıyasla vakaların yüzde 63'ünde kazanıyor.

Yandex, YandexART dağıtım sinir ağını 1.3 sürümüne güncelledi