Google'ın üretken yapay zeka video modeli özel önizlemede kullanılabilir

Sesli dinle

Veo modeli Vertex AI müşterilerine sunulmaktadır.

Google, Veo ve Imagen 3 jeneratif AI modellerine özel erişimi kullanıma sunmaya başladı. Bugünden itibaren, şirketin Vertex AI Google Cloud paketinin müşterileri, metin istemlerinden ve görsellerden videolar üretmek için Veo modelini kullanmaya başlayabilir. Bunun ardından, önümüzdeki haftadan itibaren, Google en son metinden resme çerçeve olan Imagen 3 modelini aynı kullanıcılar için kullanılabilir hale getirecek.

Google, Veo'nun piyasaya sürülmesiyle birlikte, görüntü-video modeli sunan ilk hiper ölçekli bulut sağlayıcısı olduğunu belirtiyor. Bu noktada, OpenAI'nin Sora modeli hâlâ yalnızca belirli sanatçılar, akademisyenler ve araştırmacılar için kullanılabilir durumda. Ancak, şirketin 5 Aralık'ta başlayacak olan 12 günlük ürün demosuyla ilgili ipuçları vermesiyle bu durumun hızla değişmesi bekleniyor.

Google'ın Veo video modelinin örnek görüntüleri.

Veo için Google, modelin "tutarlı ve uyumlu" 1080p görüntüler oluşturduğunu ve "bir dakikadan uzun" süreyle çalışabildiğini belirtiyor. Araç, hem metin istemleriyle hem de görsellerle çalışma yeteneğine sahip. İkinci durumda, bir videonun başlangıç noktası olarak yapay zeka tarafından oluşturulan veya insan yapımı görseller kullanılabiliyor.

Google'ın paylaştığı örnek görüntülere bakıldığında, Veo'nun tüm AI modelleri gibi neden ve sonuç ilişkisini kurmada zorluklar yaşayabileceği gözlemleniyor. Örneğin, kızartılan marshmallowların yer aldığı bir klipte, ikramlar kamp ateşinin alevine maruz kaldıklarında sararıp kömürleşmiyor. Konser görüntülerindeki ellere yakından bakıldığında ise, yapaylık ve tutarsızlıklar gözlemleniyor.

Google'ın Imagen aracından örnek çıktılar

Imagen 3'e gelince, Google, modelin "basit metin istemlerinden en gerçekçi ve en yüksek kaliteli görüntüleri ürettiğini, ayrıntı, aydınlatma ve eser azaltma açısından Imagen'in önceki sürümlerini geride bıraktığını" belirtiyor. Ancak burada da Google'ın yapması gereken daha çok iş olduğunu görmek için çok yakından bakmanıza gerek yok.

Bir grup arkadaşın bir arabanın bagajında oturduğu ilk örnekte, orijinal komut "flaşlı fotoğrafçılık"tan bahsediyor, ancak konular açıkça arkadan aydınlatılmış. Yoğun bir arka aydınlatma yaratmak için flaş kullanıldığı iddia edilebilir, ancak komutun arkasındaki fikir, 1960'ların flaşlı fotoğrafçılığını temsil eden bir şey yaratmaksa, bu görüntü öyle değil.

Yine de Google, kurumsal müşterilerinin daha fazlasının üretken AI kullanmasını istiyor. Teknoloji devi, kendi araştırmasına atıfta bulunarak, üretimde üretken AI kullanan şirketler arasında yüzde 86'sının gelirlerinde artış bildirdiğini söylüyor. Ancak yakın zamanda yapılan bir Appen anketi, AI projelerinden elde edilen yatırım getirisinin 2023'ten 2024'e 4,6 puan düştüğünü ortaya koyuyor.


0
0
0
0
0
0
0
0
0
0


henüz yorum yok
Tema Ayarları

Kendi özelleştirilmiş stilini belirle

Mod Seç

Uygulamanız için mükemmel renk modunu seçin.


RTL Mode

Dil yönünüzü değiştirin


Fluid Layout

Tam ekran modu aç/kapat

Görünüm