OpenAI’dan yapay zeka dünyasını kasıp kavuracak bir sonraki adım: Point-E

Photo of author

By admin

Yapay zeka dünyasını kasıp kavuracak bir sonraki atılım, 3B model üreten araçlar olabilir. OpenAI tarafından geliştirilen ve kullanıma sunulan açık kaynaklı Point-E, bu alanda boy gösterecek. Point-E kısaca, DALL-E benzeri bir sistem ancak farklı olarak istenileni 3 boyutlu bir modele dönüştürüyor.

Point-E, geleneksel anlamda 3B nesneler oluşturmuyor elbette zira bu sadece bir yazılım. Bunun yerine, 3B şekli temsil eden nokta bulutları ve veri noktaları kümeleri oluşturuyor. Tıpkı Google‘ın DreamFusion aracı gibi. Ancak Point-E farklı olarak çok daha hızlı. DreamFusion gibi sistemler görüntüleri oluşturmak için çok uzun bir süreye ve güçlü bir GPU sistemine ihtiyaç duyuyor. OpenAI Point-E ise tek bir Nvidia V100 kartına ve birkaç dakikaya ihtiyaç duyuyor. Zaten ismindeki E takısı da verimliliği temsil ediyor. OpenAI süreci hızlandırmak için ek bir yapay zeka sistemini eğittiğini belirtiyor.

3 boyutlu modelleme çeşitli endüstrilerde ve uygulamalarda kullanılıyor. Gişe rekortmeni filmler, video oyunları, CGI efektleri, haritalama modelleri, VR, AR ve metaverse kullanım alanlarından sadece bazıları. Günümüzde metinden görüntüye sistemler oldukça olgunlaşmış durumda. DALL-E, Stable Diffusion ve Midjourney aklıma ilk gelenlerden. Ancak metinden 3B modele sistemler farklı bir alanda ve gelişim süreci devam ediyor.
Farklı olarak Point-E iki metodu birleştiriyor: Metinden görüntüye ve görüntüden 3B modele. OpenAI ilk aşamaya zaten DALL-E ve DALL-E 2 ile oldukça hakim. İkinci aşamada ise yapay zeka 3B nesnelerle eşleştirilmiş birkaç milyon veri ile eğitildi. Ancak bu veri seti çok büyük değil, gelişime açık. O yüzdendir ki Point-E bazen bozuk veya eksik modeller oluşturabiliyor.
OpenAI tarafından paylaşılan makalede “Metodumuz bu değerlendirmede son teknoloji tekniklerden daha kötü performans gösterse de, zamanın küçük bir bölümünde numuneler üretiyor. Bu, belirli uygulamalar için daha pratik hale getirebilir veya daha yüksek kaliteli 3B nesnelerin keşfedilmesine izin verebilir.” ifadeleri kullanıldı.

Şu anda tüm gözler 2B sanat üreteçlerindeyken, model sentezleyen yapay zeka, bir sonraki büyük endüstri adımı olabilir. Ancak şimdilik konuyu bir başlangıç noktası olarak görmekte fayda var. Öte yandan önümüzdeki yıl 3B modeller üreten yapay zeka haberlerine de hazırlıklı olmak gerek. Zira bu alanın büyüklüğü yukarıda da dediğimiz gibi çok geniş.

Yorum yapın

vozol 10000 vozol 12000 vozol 12000 vozol 10000 vozol puff dizipal