Yapay Zeka Gündem Değerlendirmesi (17 Mayıs 2024)

Özet: OpenAI, metin, görsel ve ses işlemeyi birleştiren yeni gelişmiş bir çok modlu model olan GPT-4o'yu tanıttı ve performans açısından yeni standartlar belirledi. Ayrıca bir dizi yeni özellik de duyur
du.

Yeni model:

GPT-4o, metin, görsel, ses, kodlama ve İngilizce dışı üretimlerde GPT-4T'nin performansını aşarak gelişmiş performans sunar.
Yeni model, kullanımı %50 daha ucuz, GPT-4T'den 5 kat daha yüksek hız sınırlarına sahip ve önceki modellerden 2 kat daha hızlı üretim yapar.
Yeni modelin, geçen hafta Lmsys Arena'da bulunan gizemli "im-also-a-good-gpt2-chatbot" olduğu ortaya çıktı.

Ses ve diğer yükseltmeler:

Yeni ses yetenekleri arasında gerçek zamanlı yanıtlar, duygu algılama ve yanıt verme, sesin metin ve görselle birleştirilmesi yer alıyor.
Demo, gerçek zamanlı çeviri, iki yapay zeka modelinin canlı bir videoyu analiz etmesi ve özel ders ve kodlama yardımı için ses ve görüntünün kullanılması gibi özellikleri sergiledi.
OpenAI'ın blog yazısı ayrıca 3D oluşturma, yazı tipi oluşturma, görüntüler içinde metin oluşturmada büyük gelişmeler, ses efekti sentezi ve daha fazlası gibi ilerlemeleri detaylandırdı.
OpenAI ayrıca, bilgisayar iş akışlarına doğrudan entegre olan yenilenmiş bir kullanıcı arayüzüne sahip yeni bir ChatGPT masaüstü uygulamasını macOS için duyurdu.

Herkes için ücretsiz:

GPT-4o, GPT'ler ve bellek ve veri analizi gibi özellikler artık tüm kullanıcılar için kullanılabilir hale geldi ve gelişmiş yetenekler ilk kez ücretsiz katmana getirildi.
GPT-4o modeli şu anda ChatGPT'de ve API aracılığıyla tüm kullanıcılara sunuluyor, yeni ses özelliklerinin önümüzdeki haftalarda gelmesi bekleniyor.

Önemi: Gerçek zamanlı ses ve çok modlu yetenekler, yapay zekayı bir araçtan, işbirliği yaptığımız, öğrendiğimiz ve birlikte büyüdüğümüz bir zekaya dönüştürüyor. Ayrıca, (daha önce yetersiz bir GPT 3.5 ile sıkışıp kalmış olabilecek) yepyeni bir ücretsiz kullanıcı grubu, GPT-4o şeklinde hayatlarının en büyük yükseltmesini alacak.

https://openai.com/index/hello-gpt-4o/?utm_source=www.therundown.ai&utm_medium=newsletter&utm_campaign=chatgpt-s-new-voice

Özet: Google, I/O Geliştirici Konferansı'nı başlattı ve yapay zeka ekosisteminde bir dizi güncelleme duyurdu. Bu güncellemeler arasında, amiral gemisi Gemini model ailesinde yapılan geliştirmeler ve OpenAI'ın Sora'sına rakip olacak yeni bir video oluşturma modeli yer alıyor.

Gemini modeli güncellemeleri:

1.5 Pro'ya yapılan yeni güncellemeler, devasa 2 milyon içerik penceresi genişletmesi ve kod, mantık ve görüntü anlamada geliştirilmiş performans içeriyor.
Gemini 1.5 Pro, uzun içeriği kullanarak belgeler, videolar, sesler ve kod tabanları dahil olmak üzere çeşitli medya türlerini analiz edebiliyor.
Google, 1 milyon token içerik penceresine sahip, hız ve verimlilik için optimize edilmiş yeni bir model olan Gemini 1.5 Flash'ı duyurdu.
Google'ın açık kaynaklı modellerinin yeni nesli olan Gemma 2, önümüzdeki haftalarda PaliGemma adlı yeni bir görme-dil modeliyle birlikte piyasaya sürülecek.
Gemini Advanced aboneleri, yakında ChatGPT GPT'lerine benzer şekilde basit bir metin açıklamasından 'Gems' adlı özelleştirilmiş kişiler oluşturabilecekler.

Video ve görüntü modeli yükseltmeleri:

Google, metin, görüntü ve video istemlerinden 60 saniyeden uzun, 1080p çözünürlükte videolar oluşturabilen Veo adlı yeni bir video modelini tanıttı.
Yeni Imagen 3 metinden görüntüye modeli, önceki modele göre daha iyi ayrıntı, metin oluşturma ve doğal dil anlama ile tanıtıldı.
VideoFX metinden videoya aracı, storyboard sahne bazında oluşturma ve oluşturulan videolara müzik ekleme özelliğine sahip.
VideoFX, ABD'de seçili içerik oluşturucular için "özel önizleme" olarak kullanıma sunulurken, ImageFX (Imagen 3 ile birlikte) bir bekleme listesi aracılığıyla denenebilir.

Önemi: Gemini'nin zaten sektör lideri olan içerik penceresi 2 kat artırılarak, yapay zekayı büyük miktarda bilgiyle kullanmak için sonsuz yeni fırsatlar sunuyor. Ayrıca, Sora'nın etkileyici Veo demosuyla resmi olarak bir rakibi var - ancak hangisi önce herkese açık erişime ulaşacak?

Özet: Google, yapay zekayı arama alanında güçlendirmek ve Gemini'nin kullanıcılar adına daha gelişmiş eylemler gerçekleştirebilmesini sağlamak için bir dizi güncellemeyle birlikte yeni yapay zeka aracı projesi "Project Astra"yı tanıttı.

Yapay Zeka Aracı Gelişmeleri:

Google, kullanıcının yerine görebilen, duyabilen ve eylemler gerçekleştirebilen gerçek zamanlı bir yapay zeka aracı prototipi olan Project Astra'yı duyurdu.
Demo, gelişmiş muhakeme ve hatırlama yeteneklerine sahip, kod, görüntü ve video dahil olmak üzere gördüklerine ve duyduklarına yanıt veren bir sesli asistanı sergiledi.
Astra'nın bu yılın ilerleyen zamanlarında Gemini uygulaması aracılığıyla herkese açık erişime sunulması bekleniyor.
Google ayrıca, Workspace içinde e-postalar, toplantılar ve diğer verilerle ilgili soruları yanıtlayabilen "AI ekip arkadaşlarını" tanıttı.
Kullanıcıların Gemini ile neredeyse gerçek zamanlı olarak konuşup iletişim kurabilmelerini sağlayan "Live" da önümüzdeki aylarda kullanıma sunulacak.

Arama Geliştirmeleri:

Google Arama artık genişletilmiş Yapay Zeka Genel Bakışları, gelişmiş planlama yetenekleri ve yapay zeka tarafından düzenlenen arama sonuçları sunuyor.
Gemini, seyahat planları oluşturma, sürdürme ve güncelleme gibi daha karmaşık planlamaları yürütebilecek.
Arama ayrıca "çok adımlı muhakeme" yetenekleri de kazanacak, bu da Gemini'nin soruları parçalara ayırmasına ve araştırmayı hızlandırmasına olanak tanıyacak.
Kullanıcılar artık video ile soru sorabilecek ve Arama'nın görsel içeriği analiz ederek faydalı Yapay Zeka Genel Bakışları sunmasına olanak tanıyacak.

Önemi: Resmi olarak yeni bir sesli asistan savaşımız var - OpenAI ve Google, sadece son iki gün içinde akıl almaz yeni yetenekler sergiliyorlar. Ayrıca, bir OpenAI arama ürünü söylentilerine ve Perplexity gibi platformlara olan heyecana rağmen, arama kralını tahttan indirmek zor olacak. Özellikle de Google, gelişmiş yapay zekayı tüm ekosisteme etkileyici bir şekilde entegre ederken.

https://www.youtube.com/watch?v=XEzRZ35urlk

Özet: OpenAI'nın kurucu ortağı ve baş bilim insanı Ilya Sutskever, Kasım 2023'te Sam Altman'ın görevden alınmasıyla ilgili aylarca süren spekülasyonların ardından şirketten ayrıldığını duyurdu.

Ayrıntıları:

Sutskever, OpenAI'ın mevcut liderlik altında "hem güvenli hem de faydalı bir AGI (genel yapay zeka)" geliştireceğine güvendiğini belirtti.
Sutskever ile birlikte, üstün uyum ekibinin diğer eş lideri Jan Leike de şifreli bir istifa mesajıyla ayrıldığını duyurdu.
Bu haber, çoğunlukla OpenAI'ın üstün uyum ve güvenlik ekiplerinden gelen aylarca süren ayrılıkların ardından geldi ve spekülasyonları körükledi.
OpenAI CEO'su Sam Altman, GPT-4'ün yaratılmasında kilit bir araştırmacı olan Jakub Pachocki'yi yeni baş bilim insanı olarak atadı.

Önemi: Aylarca süren gerginliklerin ardından, Ilya'nın Sam ile olan geleceği hakkındaki spekülasyonlar nihayet sona erdi. Ancak, güvenlik ekibi ayrılıklarıyla ilgili sorular hala devam ediyor. Ayrıca, yapay zekanın en parlak iki zihni artık resmi olarak piyasada olduğu için, Sutskever ve Leike'nin nereye gideceğini izlemek de önemli olacak.

https://x.com/ilyasut/status/1790517455628198322?utm_source=www.therundown.ai&utm_medium=newsletter&utm_campaign=openai-co-founder-officially-leaves

Özet: Apple, iOS 18 ile birlikte gelecek bir dizi yeni erişilebilirlik özelliği duyurdu. Bunlar arasında yapay zeka destekli Göz Takibi, Müzik Haptikleri, Sesli Kısayollar ve daha fazlası bulunuyor.

Detaylar:

Göz Takibi, kullanıcılara ek donanım veya aksesuara ihtiyaç duymadan sadece gözlerini kullanarak iPad veya iPhone'larını kontrol etme imkanı sunuyor.
Müzik Haptikleri, kullanıcıların iPhone'un Taptic Engine'i aracılığıyla müziği hissetmelerine olanak tanıyacak.
Sesli Kısayollar, kullanıcıların Siri'nin anlayabileceği özel ifadeler atayarak kısayollar başlatmasına ve görevler yürütmesine izin verecek.
Yeni özellikler, bu yılın ilerleyen aylarında iOS 18 ve iPadOS 18 gibi yazılım güncellemeleriyle kullanıma sunulacak.

Önemi: Yapay zeka destekli göz takibi ilk bakışta bir parti numarası gibi görünse de, fiziksel engelli kullanıcılar için erişilebilirliği genişletmede önemli bir adım olabilir. Şu anda yolda olan bir dizi yapay zeka özelliğiyle (ve söylentilere göre OpenAI ortaklığıyla), Apple'ın 10 Haziran'daki WWDC konferansı yapay zeka topluluğu için büyük bir dikkatle izlenecek.

Yazar