Yapay Zeka Gündem Değerlendirmesi (28 Haziran 2024)

Özet: Nvidia, çeşitli sektörlerde güçlü yapay zeka uygulamaları oluşturmak ve yüksek kaliteli sentetik eğitim verileri üretmek için tasarlanmış açık kaynaklı dil modelleri ailesi Nemotron-4 340B'yi tanıttı.

Detaylar:

Üç model (Base, Instruct, Reward), yeni ve güçlü büyük dil modellerini (LLM) eğitmek için sentetik veri oluşturma "hattı" oluşturur.
Instruct, yüksek kaliteli sentetik eğitim verileri oluşturur (ve %98 sentetik verilerle eğitilmiştir), Reward ise en yüksek kaliteli örnekler için veriyi filtreler.
Nemotron-4 modelleri, Llama-3, Mixtral ve Qwen-2 gibi açık kaynaklı rakiplerle çeşitli kriterlerde eşleşir veya onları aşar.
Nvidia ayrıca, benzer transformatör tabanlı LLM'leri doğrulukta geride bırakan seçici bir durum-uzay modeli (SSM) olan Mamba-2 Hybrid'i piyasaya sürdü.

Neden önemli: Nvidia, yalnızca alanındaki en iyi rakiplerin yetenekleriyle eşleşen değil, aynı zamanda yeni büyük dil modellerinin seviyesini yükseltmek için gerekli sentetik verileri oluşturma konusunda da üstün olan ücretsiz, açık kaynaklı bir model ailesi sundu. Çip üretim devi, birçok yeteneğe sahip bir yapay zeka gücü haline gelmiştir.

https://blogs.nvidia.com/blog/nemotron-4-synthetic-data-generation-llm-training/?utm_source=www.therundown.ai&utm_medium=newsletter&utm_campaign=nvidia-s-reveals-an-open-ai-model

Özet: Çinli bir girişim olan Ex-Robots, insan yüz ifadelerini ve duygularını yakından taklit edebilen ultra-gerçekçi insansı robotlar geliştiriyor.

Detaylar:

Ex-Robots’un gerçekçi insansı robotları, silikon yüzlerine gömülü küçük motorlar kullanarak gülümseme, kaş çatma ve ince yüz hareketlerini kopyalayabiliyor.
Girişim, robotların çevrelerini algılayarak duyguları tanıması ve ifade etmesi için çok modlu yapay zeka ve algoritmalar kullanıyor.
Bir insansı robotun oluşturulması şu anda 2-4 hafta sürüyor ve birim başına maliyetler 275 bin dolara kadar çıkabiliyor.
Şirket, yakın vadede müze sergilerinde kullanım öngörüyor ve nihai olarak sağlık hizmetleri, terapi ve çocuk hizmetlerinde rol almasını planlıyor.

Neden önemli: Ultra-gerçekçi robotların yapay zeka gücüyle birleşmesi, bazı tuhaf yeni sınırlar yaratmak üzere. İnsanlar, Tesla’nın Optimus gibi mekanik seçeneklerin yerine, gerçekten insan görünümlü insansı robotlardan rahatsız olacak mı? Dünyanın buna hazır olup olmadığı belirsiz, ama yakında öğreneceğiz.

https://www.reuters.com/technology/chinas-ex-robots-develops-humanoids-with-enhanced-facial-movement-2024-06-11/?utm_source=www.therundown.ai&utm_medium=newsletter&utm_campaign=nvidia-s-reveals-an-open-ai-model

Özet: Sağlık teknolojisi şirketi Color, doktorların kişiselleştirilmiş kanser tarama ve tedavi planları oluşturmasına yardımcı olacak bir yapay zeka asistanı yaratmak için OpenAI ile ortaklık kurdu — bu, bakım gecikmelerini büyük ölçüde azaltmayı amaçlıyor.

Detaylar:

Color’un GPT-4o üzerine kurulu yapay zeka yardımcı pilotu, tarama boşluklarını belirlemek ve kişiselleştirilmiş tanı planları oluşturmak için hasta verilerini, yönergeleri ve tıbbi kayıtları analiz eder.
Tedavi öncesi işlemleri otomatikleştirmek, tedavi süresinden hayati haftalar veya aylar kazandırır — kanser mortalite riski her ay gecikme ile %6-13 artar.
Testlerde, yapay zeka yardımcı pilotunu kullanan doktorlar, kullanmayanlara göre 4 kat daha fazla eksik laboratuvar ve test tespit etti.
Color, 2024 sonuna kadar 200.000'den fazla hasta için yapay zeka tarafından oluşturulan tarama planları sağlamayı hedefliyor.

Neden önemli: Dünya genelinde ikinci önde gelen ölüm nedenini tedavi ederken, her gün önemlidir — ve yine de kanser hastaları sıklıkla gecikmiş teşhis ve tedavi nedeniyle acı çeker. Color’un yapay zeka yardımcı pilotunun bu süreçleri kolaylaştırma yeteneği, kanserle zorlu mücadelede büyük fark yaratabilir.

https://openai.com/index/color-health/?utm_source=www.therundown.ai&utm_medium=newsletter&utm_campaign=openai-tackles-ai-cancer-care

Özet: Runway, metin istemleri ve görüntülerden son derece gerçekçi 10 saniyelik video klipler oluşturabilen güçlü yeni bir yapay zeka modeli olan Gen-3 Alpha'yı tanıttı — bu model tutarlılık, hareket ve yapı iyileştirmeleri sunuyor.

Detaylar:

Gen-3 Alpha, Runway'in bir sonraki nesil model serisindeki ilk model olup, "genel dünya modelleri" öğrenimi için yeni büyük ölçekli çok modlu bir altyapı üzerinde eğitildi.
Model hem görüntüler hem de videolar üzerinde eğitildi ve Runway'in mevcut araçları olan Motion Brush ve Director moduyla entegre olarak gelişmiş düzenleme imkanı sağlıyor.
Ana yetenekler arasında gerçekçi karakterler, sinematik kamera teknikleri ve sahne değişiklikleri arasında daha yumuşak geçişler bulunuyor.

Neden önemli: Haziran 2024, yapay zeka video hızlandırmasının ayı oldu. KLING, Luma ve Runway'in kamuya açık modelleri piyasaya sürmesi ve OpenAI'nin Sora ve Google’ın Veo gibi devlerinin beklemede olmasıyla birlikte — üretken video, büyük bir çıkış yapıyor.

https://runwayml.com/blog/introducing-gen-3-alpha/?utm_source=www.therundown.ai&utm_medium=newsletter&utm_campaign=openai-tackles-ai-cancer-care

Özet: TikTok, markaların ve içerik oluşturucuların platformda içerik üretmesini daha verimli hale getirmek için yeni bir yapay zeka özellikleri paketi olan Symphony'yi başlattı — dijital avatarlar, çeviri araçları, bir yapay zeka asistanı ve daha fazlası dahil.

Detaylar:

Symphony Dijital Avatarları, markaların TikTok reklamlarında ve çeşitli dillerdeki markalı içeriklerinde yer almak üzere yapay zeka sözcüleri oluşturmasını sağlar.
Markalar, gerçek aktörlere dayalı ‘stok avatarlar’ arasından seçim yapabilir veya sanal marka temsilcileri olarak hizmet verecek özel avatarlar oluşturabilir.
Yeni bir AI Dubbing aracı, videoları otomatik olarak 10’dan fazla dile transkribe eder, çevirir ve dublaj yapar, böylece markaların içeriği küresel ölçekte ölçeklendirmesine yardımcı olur.
TikTok’un Yaratıcı Asistanı, platforma içerik için beyin fırtınası yapma, senaryo yazma ve optimize etme konularında yardımcı olan bir sohbet robotu olan Symphony Asistanı olarak yeniden markalandı.

Neden önemli: Yaratıcı ekonomi, yapay zeka ile tamamen yeniden şekillenecek ve bu araçlar, optimize edilmiş içerik, erişim ve yaratım için yeni fırsatlar sunacak — ancak dijital ‘sözcülerin’ yükselişi, markaların otantiklik ve tüketici güveni konularında yeni sorularla karşı karşıya kalmasına da yol açacak.

https://www.tiktok.com/business/en-US/blog/tiktok-symphony-ai-creative-suite?utm_source=www.therundown.ai&utm_medium=newsletter&utm_campaign=tiktok-introduces-ai-avatars

Özet: Ilya Sutskever, OpenAI'den resmen ayrılmasından sadece bir ay sonra, tamamen güvenli ve güçlü süper zekanın geliştirilmesine odaklanan yeni bir yapay zeka girişimi başlattı.

Detaylar:

Safe Superintelligence (SSI) adlı şirket, Sutskever, eski Y Combinator ortağı Daniel Gross ve eski OpenAI mühendisi Daniel Levy tarafından kuruldu.
SSI’nın tek misyonu, Sutskever'in 'on yıl içinde' ortaya çıkabileceğine inandığı faydalı süper zeki yapay zeka yaratmaktır.
OpenAI'nin ticari ürünlere yönelmesinin aksine, SSI kısa vadeli dış ticari etkilerden tamamen izole edilmiş saf bir araştırma organizasyonu olacak.
Finansman açıklanmadı, ancak Gross 'karşılaştığımız tüm sorunlar arasında, sermaye artırmanın bir sorun olmayacağını' belirtti.

Neden önemli: Ilya ne gördü? Belki de süper zekaya giden yeni, güvenli bir yol vizyonuydu. Sutskever’in OpenAI ile yaşadığı yönetim kurulu dramaları ve ardından yaşanan sorunların ardından geçen aylarca süren spekülasyonlardan sonra, SSI onun istediği güvenlik odaklı yapay zeka laboratuvarını kurmak için yeni bir yol açıyor — ve şirketin finansman veya yetenek bulma konusunda herhangi bir sıkıntı yaşamayacağı kesin.

https://x.com/ilyasut/status/1803472978753303014?utm_source=www.therundown.ai&utm_medium=newsletter&utm_campaign=openai-co-founder-announces-new-ai-startup

Özet: Anthropic, GPT-4o ve selefi Opus'u çeşitli kriterlerde aşan ve önemli hız artışları ve maliyet düşüşleri sağlayan yeni yükseltilmiş modeli Claude 3.5 Sonnet'i tanıttı.

Detaylar:

3.5 Sonnet, Opus’un hızının 2 katına sahip ve token fiyatı, Anthropic'in önceki üst düzey modelinin maliyetinin 1/5'i kadar.
3.5 Sonnet, akıl yürütme, kod, matematik ve bilgi yetenekleri gibi çeşitli kriterlerde Opus ve GPT-4o'yu geride bırakıyor.
Anthropic, kullanıcıların Claude ile gerçek zamanlı yan panel çalışma alanında görüntüleme, düzenleme ve inşa etmesine olanak tanıyan yeni bir özellik olan 'Artifacts'ı tanıttı.
Şirket, yılın ilerleyen zamanlarında Haiku ve Opus'un 3.5 sürümleri ile Memory gibi yeni özelliklerin geleceğini duyurdu.

Neden önemli: GPT-4o kısa bir süreliğine LLM liderlik tablosunda zirveyi ele geçirdikten sonra, Anthropic’in son yükseltmesi tahtı geri almış gibi görünüyor. Model hızlandırma yavaşlamıyor — ve 3.5 Sonnet şimdiden bu kadar iyiyse, yakında çıkacak olan 3.5 Opus sürümü LLM'leri çarpıcı yeni zirvelere taşıyabilir.

https://www.anthropic.com/news/claude-3-5-sonnet?utm_source=www.therundown.ai&utm_medium=newsletter&utm_campaign=anthropic-s-new-llm-takes-on-gpt-4o

Özet: Apple’ın, sosyal medya devinin üretken yapay zeka modellerini Apple Intelligence'a entegre etmek için Meta ile görüşmelerde bulunduğu bildiriliyor — bu, iki rakibin önceki soğuk ilişkilerinde olası bir yumuşama sinyali veriyor.

Detaylar:

Apple, OpenAI'nin ötesinde ortaklıkları araştırıyor ve Meta, Perplexity ve Anthropic, yeni Apple Intelligence sisteminde ChatGPT'ye katılabilir.
Bu görüşmeler, özellikle gizlilik sorunları ve Apple App Store politikaları konusundaki uzun süreli rekabetleri nedeniyle şaşırtıcı.
Söylentilere göre, anlaşma yapısı Meta ve diğer yapay zeka ortaklarının Apple cihazları üzerinden premium abonelikler sunmasına izin verecek ve Apple, gelirden bir pay alacak.
Apple yazılım şefi Craig Federighi, WWDC'de şirketin birden fazla yapay zeka seçeneği sunma planına işaret etti.

Neden önemli: Bu olası ortaklık, uzun süredir rakip olan şirketler arasında büyük bir değişim sinyali veriyor… Ama belki de yapay zeka devrimi bizi bir araya getiriyor? Apple için, çeşitli modelleri güvence altına almak, kullanıcılara her görev için en iyi seçeneği sunar — Meta ise yapay zeka çabaları için büyük bir yeni dağıtım modeli elde eder.

https://www.wsj.com/tech/ai/apple-meta-have-discussed-an-ai-partnership-cc57437e?utm_source=www.therundown.ai&utm_medium=newsletter&utm_campaign=apple-and-meta-discuss-major-ai-partnership

Özet: Universal Music Group, Warner Music Group ve Sony Music Entertainment, müzik oluşturma startup'ları Udio ve Suno'ya karşı dava açtı ve bu şirketlerin telif hakkıyla korunan materyaller üzerinde yasa dışı olarak AI modellerini eğittiklerini iddia etti.

Detaylar:

Recording Industry Association of America (RIAA), davalara liderlik ediyor ve ihlal edilen her eser için 150.000 dolara kadar ceza talep ediyor; potansiyel olarak milyarlarca dolarlık zararlar söz konusu.
Plak şirketleri, Suno ve Udio'nun izinsiz veya tazminat ödemeden telif hakkıyla korunan kayıtları AI modellerinde eğittiklerini iddia ediyor.
RIAA, platformların çıktılarının belirli sanatçıları ve hit şarkıları taklit ettiğini ve şirketlerin telif hakkıyla korunan materyaller üzerinde eğittiklerini itiraf ettiklerini iddia ediyor.
Her iki startup da son zamanlarda önemli fonlama sağladı; Suno Mayıs ayında 125 milyon dolar ve Udio 10 milyon dolar aldı.

Neden önemli: Metin ve görüntü oluşturma platformlarının karşılaştığı hukuki sorunlar, şimdi AI müzik için de geçerli hale geldi — ancak diğer sektörlerin aksine, plak şirketleri AI firmalarıyla çalışmayı daha proaktif bir şekilde araştırmış görünüyor. Bu son davalara, endüstri için gerçek öncüller mi olacak yoksa sadece ağır tazminatlar ve sonunda lisans anlaşmaları mı getirecek, zaman gösterecek.

https://www.bloomberg.com/news/articles/2024-06-24/sony-warner-universal-sue-suno-udio-for-training-ai-on-copyrighted-music?utm_source=www.therundown.ai&utm_medium=newsletter&utm_campaign=major-labels-sue-ai-music-generators

Özet: AI avatar startup Synthesia, önemli bir platform güncellemesi duyurdu ve HD kameralar, web kamerası veya telefon kullanarak kullanıcıların kendilerinin dijital ikizlerini oluşturabilecekleri yeni özellikler sunuyor.

Detaylar:

Yeni 'Kişisel AI Avatarlar', kullanıcıların dudak senkronizasyonu ve gerçekçilik ile kendilerinin dijital ikizlerini oluşturmalarına olanak tanır.
Synthesia, ilerleyen zamanlarda tam bedenli avatarların geleceğini müjdeledi; bu avatarlar tamamen kontrol edilebilir olacak ve daha fazla kişilik ve animasyon seçeneği sunacak.
Güncellenmiş AI Video Asistanı, marka özel unsurlarla birlikte mevcut bilgi tabanlarından tam video kütüphaneleri üretebilecek.
Şirket ayrıca, izleyicilerin diline otomatik olarak adapte olan kişiselleştirilmiş, etkileşimli deneyimler sunan yeni bir video oynatıcı üzerinde çalışıyor.

Neden önemli: Geçtiğimiz ay Zoom'un kurucusu, dijital ikizlerimizin toplantılara katıldığı bir dünyanın geleceğini öngördü — ve henüz oraya ulaşmasak da, AI avatar platformları neredeyse gerçeklikten ayırt edilemeyen bir bölgeye ilerliyor. Video iletişimi, çoğu insanın düşündüğünden çok daha yakın bir zamanda yeniden tanımlanacak gibi görünüyor.

https://www.synthesia.io/post/introducing-synthesia-video-communications-platform?utm_source=www.therundown.ai&utm_medium=newsletter&utm_campaign=major-labels-sue-ai-music-generators

Özet: OpenAI, Mayıs ayında gösterilen ve büyük heyecan uyandıran Voice Mode özelliğinin lansmanını güvenlik testlerinin ve iyileştirmelerin daha fazla yapılması gerektiği gerekçesiyle ertelediğini duyurdu.

Detaylar:

OpenAI, Voice Mode'un Mayıs'ın Bahar Güncellemesi'nden 'birkaç hafta' sonra kullanıma sunulacağını önce belirtmişti, ancak erişimin şimdi sonbaharda ödeme yapan kullanıcılara verilmesi bekleniyor.
Alpha test grubu başlangıçta Haziran ayının sonlarına planlanmıştı, ancak daha fazla güvenlik kontrolü için bir ay ertelendi.
İlk demo, 'Sky' modelinin oyuncu Scarlett Johansson'a benzerliği nedeniyle tartışma yaratmıştı, ancak OpenAI herhangi bir hatalı davranışı reddetti.
Ayrıca, şirket Mac kullanıcıları için ChatGPT masaüstü uygulamasını da yayınladı; bu, dosyalar, ekran paylaşımı ve konuşmalar arasında daha geniş entegrasyon sağlıyor.

Neden önemli: Önceki lansman zaman çizelgesini kaçırmış olmasından sonra hayal kırıklığı yaratıcı olsa da, bir ürünü düşük kalitede piyasaya sürmekten daha iyidir — özellikle de hype'ın büyük olduğu durumlarda. Ancak aşırı vaat etmek ve altında kalmak riskli bir iş, özellikle OpenAI'in giderek artan rekabet karşısında (aşağıda Anthropic'in son gelişmelerine bakınız).

https://x.com/OpenAI/status/1805716393524183136?utm_source=www.therundown.ai&utm_medium=newsletter&utm_campaign=openai-hits-pause-on-voice-mode

Özet: Google, açık hafif AI model serisi olan Gemma'nın yeni nesli Gemma 2'yi ve Gemini 1.5 Pro modelindeki yeni güncellemeleri duyurdu.

Detaylar:

Gemma 2, 9 milyar parametreli bir model ve daha büyük, 27 milyar parametreli bir model olmak üzere iki farklı boyutta sunuluyor; gelecekte 2.6 milyar parametreli hafif bir versiyon da müjdelendi.
27 milyar parametreli model, iki katından daha büyük modellere rekabetçi performans sunarken, 9 milyar parametreli model Llama 3 8B gibi benzer sınıf modellerin önemli ölçüde önünde yer alıyor.
Gemma 2'nin yanı sıra, Google ayrıca Gemini 1.5 Pro'nun 2 milyon tokenlik bağlam penceresine erişimi açtı, çok daha uzun girdilerin işlenmesine olanak tanıyor.
Gemini Pro ve Flash için yeni kod yetenekleri, modellerin Python kodu üretip çalıştırmasına olanak tanıyarak matematik ve veri mantığı görevlerinde doğruluğu artırıyor.

Neden önemli: Google'ın Gemma güncellemeleri, tek bir GPU üzerinde verimli (ve ekonomik) bir şekilde çalışırken açık kaynaklı güç merkezini zirveye taşıyor. Ayrıca, Gemini'nin 2 milyonluk bağlam penceresi açılışı da kullanıcılara yeni ve etkileyici yetenekler sunuyor.

https://blog.google/technology/developers/google-gemma-2/?utm_source=www.therundown.ai&utm_medium=newsletter&utm_campaign=google-s-major-ai-upgrades

Yazar