Yapay Zeka Gündem Değerlendirmesi (14 Temmuz 2024)

Özet: Bloomberg'in yeni bir raporuna göre, Apple, Apple Intelligence girişimi kapsamındaki yeni yapay zeka özelliklerini Vision Pro kulaklıklarına getirmeye çalışıyor.

Detaylar:

Apple Intelligence, WWDC sırasında Mac, iPhone ve iPad için duyurulmuştu, ancak şimdi Vision Pro kulaklığı için de uyarlanıyor.
Bloomberg, bu özelliklerin bu yıl cihazda beklenmediğini, ancak şirketin ürün hattının satışlarını artırmanın yollarını aradığını belirtti.
Apple Intelligence paketi, geliştirilmiş bir Siri, yazma araçları ve OpenAI destekli bir sohbet botu gibi yapay zeka özelliklerini içerecek.
Rapor ayrıca WSJ’nin Apple-Meta ortaklığına dair söylentileri genişletti ve Apple’ın bu anlaşmaya ‘sıfır ilgi’ gösterdiğini söyledi.

Neden önemli: Apple Vision Pro'nun geleceğe yönelik yetenekleri ve yapay zeka ile sağlanan gelişmiş iş akışları mükemmel bir uyum sağlıyor — tabii ki, yüksek fiyat etiketini ödemeye istekli birileri varsa. Kullanıcılar, yeni teknolojiye yönelmek için önemli bir fiyat indirimi görmeleri gerekebilir, yapay zeka ile hangi özellikler eklenirse eklensin.

https://www.bloomberg.com/news/newsletters/2024-06-30/apple-s-longer-lasting-devices-ios-19-and-apple-intelligence-on-the-vision-pro-ly1jnrw4?utm_source=www.therundown.ai&utm_medium=newsletter&utm_campaign=apple-intelligence-vision-pro

Özet: Agility Robotics, 2023 yılında Spanx tesislerinde başarılı bir pilot uygulamanın ardından, GXO Logistics ile çok yıllı bir anlaşma imzalayarak şirketin Digit insansı robotlarını depolara getirecek.

Detaylar:

Bu anlaşma, insansı robotların ilk Robotlar-hizmet-olarak (RaaS) anlaşması ve ‘resmi ticari dağıtımı’ olarak nitelendiriliyor.
Agility'nin Digit robotları, Connecticut'taki bir Spanx tesisinde GXO'nun lojistik operasyonlarına entegre edilecek ve tekrarlayan görevler ile lojistik işlerini yürütecek.
1,75 metre boyundaki Digit, 16 kilogram kadar ağırlık kaldırabilir ve tüm filoları kontrol etmek ve tesis iş akışlarını optimize etmek için bulut tabanlı Agility Arc platformu ile entegre çalışır.
Digit, 2023 yılında Spanx ile bir konsept kanıtı denemesi yaptı ve Amazon da kendi depolarında robotları test etti.

Neden önemli: RaaS yeni SaaS mı oluyor? Yakında her şirket, gelişmiş robotları iş gücüne dahil etmeye çalışacak — ve abonelik hizmetleri, büyük peşin maliyetler olmadan ölçeklendirmek için gereken finansal ve teknik engelleri azaltabilir.

https://agilityrobotics.com/content/gxo-signs-industry-first-multi-year-agreement-with-agility-robotics?utm_source=www.therundown.ai&utm_medium=newsletter&utm_campaign=apple-intelligence-vision-pro

Özet: Runway, AI video oluşturucusu Gen-3 Alpha'nın, modelin Haziran ortasında piyasaya sürülmesinin ardından haftalar süren etkileyici ve viral çıktılardan sonra artık tüm kullanıcılara açık olduğunu duyurdu.

Detaylar:

Runway, geçen ay Gen-3 Alpha'yı, 'genel dünya modelleri' öğrenmek üzere eğitilmiş yeni nesil serisinin ilk modeli olarak tanıttı.
Gen-3 Alpha, karakter ve sahne tutarlılığı, kamera hareketleri ve teknikleri, sahneler arası geçişler gibi temel özellikleri yükseltiyor.
Gen-3 Alpha, kullanıcıların ayda 63 saniye üretim almasını sağlayan Runway'in 'Standart' aylık 12 dolarlık erişim planının arkasında mevcuttur.
Cuma günü, AI University'mizde Gen-3, ElevenLabs ve Midjourney kullanarak AI ticari video oluşturma konusunu ele alan ücretsiz, uygulamalı bir atölye çalışması düzenliyoruz.

Neden önemli: KLING ve Luma Labs'ın son dönemdeki etkileyici çıkışlarına rağmen, Runway'in Gen-3 Alpha modeli, Sora'dan bu yana AI videolarında en büyük sıçrama gibi görünüyor. Ancak, sınırsız planlar dışındaki kullanıcılar için küçük üretim limitleri, güçlü kullanıcılar için bir engel olabilir.

https://x.com/runwayml/status/1807822396415467686?utm_source=www.therundown.ai&utm_medium=newsletter&utm_campaign=the-best-ai-video-since-sora

Özet: AI ses şirketi ElevenLabs, kullanıcıların metinleri ünlü Hollywood yıldızlarının AI tarafından oluşturulan sesleriyle dinlemelerine olanak tanıyan yeni 'İkonik Sesler' özelliğini, yakın zamanda piyasaya sürülen Reader App için duyurdu.

Detaylar:

İlk kadroda Judy Garland, James Dean, Burt Reynolds ve Sir Laurence Olivier'in AI ile yeniden oluşturulmuş sesleri yer alıyor ve önümüzdeki aylarda daha fazlası eklenecek.
ElevenLabs, merhum ünlülerin miraslarını yöneten CMG Worldwide ile sesler için lisans anlaşmaları yaptı.
Kullanıcılar, Reader App içinde mevcut olan kitaplar, makaleler, PDF'ler ve diğer metin içeriklerini AI sesleriyle dinleyebilirler.
Sesler yalnızca Reader App içinde kullanılabilir ve platformda paylaşılabilir içerik oluşturmak için seçilemez.

Neden önemli: Bir seslendirme sanatçısıysanız, rekabet artık çok daha çetin hale geldi. ElevenLabs, sadece AI tarafından oluşturulan ses klonlarının güçlü geleceğini göstermekle kalmıyor, aynı zamanda merhum Hollywood yıldızlarının miraslarıyla doğrudan çalışarak sektör için güçlü bir lisanslama örneği oluşturuyor.

https://elevenlabs.io/blog/iconic-voices?utm_source=www.therundown.ai&utm_medium=newsletter&utm_campaign=hollywood-s-new-ai-narrators

Özet: Fransız girişimi Kyutai, OpenAI'nin gecikmeli Ses Modu özelliğine benzer şekilde çeşitli duygular ve tarzlarda yanıt verebilen yeni ‘gerçek zamanlı’ AI ses asistanı Moshi'yi tanıttı.

Detaylar:

Moshi, aynı anda dinleyip konuşabilen, fısıltılardan aksanlı konuşmalara kadar 70 farklı duygu ve konuşma tarzında yanıt verebilen bir AI ses asistanıdır.
Kyutai, Moshi'nin 160ms gecikme süresi ile piyasaya sürülen ilk ‘gerçek zamanlı ses AI asistanı’ olduğunu ve OpenAI'nin teklifini geçebileceğini iddia ediyor.
Kar amacı gütmeyen grup, araştırma ve modeli önümüzdeki haftalarda açık kaynaklı hale getirmeyi planlıyor, Moshi şu anda Hugging Face üzerinden denemeye açık.
Girişim, 2023 yılında 324 milyon dolarlık finansmanla kuruldu ve 8 araştırmacıdan oluşan bir ekip, Moshi'yi sadece dört ayda geliştirdi.

Neden önemli: Moshi, Fransız AI sahnesi için büyük bir zafer gibi görünüyor ve OpenAI'nin diğer alanlardaki üstünlüğünü sarsan bir başka göz açıcı rakip. Ayrıca, bu modelin sunumunda Fransız aksanıyla ilgili endişeler kesinlikle olmayacak.

https://www.youtube.com/live/hm2IJSKcYvo

Özet: Radboud Üniversitesi'ndeki araştırmacılar, bir kişinin beyin aktiviteleri kaydına dayanarak baktığı şeyin şaşırtıcı derecede doğru görüntülerini yeniden oluşturabilen bir AI sistemi geliştirdi.

Detaylar:

Ekip, beyin aktivitelerini yakalamak için insanlardan fMRI taramaları ve bir makak maymunundan doğrudan elektrot kayıtlarını kullanarak görüntülere bakarken beyin aktivitesini izledi.
Geliştirilmiş AI sistemi, beynin hangi kısımlarına odaklanacağını öğrendi ve bu da yeniden oluşturma doğruluğunu önemli ölçüde artırdı.
Yukarıdaki görüntüde, üst sıra maymunun gördüğü şeyleri, alt sıra ise AI sisteminin beyin aktivitesine dayanarak yeniden oluşturduğu görüntüleri gösteriyor.
Baş araştırmacı Umut Güçlü, bunların bugüne kadar "en yakın ve en doğru yeniden oluşturulan" görüntüler olduğunu iddia ediyor.

Neden önemli: Çalışmanın bazı sınırlamaları olsa da (örneğin, zaten veri setinde bulunan görüntüleri kullanmak gibi), bu araştırma hala çok etkileyici. İnme hastalarına iletişimde yardımcı olmaktan rüyaları yeniden yaratmaya kadar, bu teknolojinin iyileşmeye devam ettikçe toplumda büyük uygulamaları olacağı öngörülüyor.

https://www.newscientist.com/article/2438107-mind-reading-ai-recreates-what-youre-looking-at-with-amazing-accuracy/?utm_source=www.therundown.ai&utm_medium=newsletter&utm_campaign=mind-reading-ai

Özet: Viral bir video, Phoenix polis memurunun karşı yönde giden bir Waymo robotaksiyi durdurma anını yakaladı; ancak sürücü koltuğu boştu ve polis memuru oldukça şaşkındı.

Detaylar:

X'te paylaşılan videoda, sürücüsüz Waymo robotaksinin trafiğin karşı şeridine girmesi sonrası bir polis memuru tarafından durdurulması gösteriliyor.
Polis yaklaşırken, sürücüsü olmayan robotaksi camını indirdi ve polis memurunu Waymo destek temsilcisine bağladı.
Waymo, aracın davranışının "tutarsız inşaat işaretlemeleri" nedeniyle olduğunu belirterek olayı doğruladı.
Bu olay, Waymo'nun direk benzeri nesnelerden kaçınamaması nedeniyle 672 aracı geri çağırmasından sadece birkaç hafta sonra gerçekleşti.

Neden önemli: Bir polisin bir bilgisayara ceza yazmaya çalışması komik olsa da, mevcut trafik yasalarındaki ciddi boşlukları ortaya koyuyor. Waymo ve Tesla, otonom sürüş teknolojisini mükemmelleştirmek için yarışırken, bu tür gerçek dünya aksaklıkları karşılaşılan zorlukları gözler önüne seriyor. Sürücü olmadığında kime ceza kesersiniz?

https://x.com/CollinRugg/status/1808876793149206845?utm_source=www.therundown.ai&utm_medium=newsletter&utm_campaign=mind-reading-ai

Özet: New York Times'ın yeni raporuna göre, bir hacker geçen yıl OpenAI'nin iç mesajlaşma sistemlerini ihlal ederek şirketin teknolojisi hakkında hassas detayları çaldı ve bu olay kamuya veya yetkililere bildirilmedi.

Detaylar:

İhlal, 2023 yılının başlarında gerçekleşti ve hacker, çalışanların OpenAI'nin son teknoloji ilerlemelerini tartıştığı çevrimiçi bir foruma erişim sağladı.
Temel AI sistemleri ve müşteri verileri tehlikeye atılmamış olsa da, AI tasarımlarına dair iç tartışmalar ifşa edildi.
OpenAI, çalışanları ve yönetim kurulunu Nisan 2023'te bilgilendirdi ancak olayı kamuya veya kolluk kuvvetlerine bildirmedi.
Eski araştırmacı Leopold Aschenbrenner (daha sonra hassas bilgileri sızdırdığı iddiasıyla işten çıkarıldı), hack olayının ardından OpenAI'nin güvenliğini eleştiren bir not yazdı.
OpenAI, gelecekteki riskleri ele almak için eski NSA başkanı Paul Nakasone'un da dahil olduğu bir Güvenlik ve Emniyet Komitesi kurdu.

Neden önemli: OpenAI'nin gizli teknolojisi dış dünyaya sızmış olabilir mi? Diğer oyuncular AI yarışında sahayı dengelerken, sızıntıların ve hack olaylarının gelişimde rol oynayıp oynamadığını merak etmek adil olur. Rapor ayrıca Aschenbrenner'in işten çıkarılması konusuna yeni bir ilgi katıyor; kendisi, işten çıkarılmasının politik nedenlerle olduğunu iddia ediyor.

https://www.nytimes.com/2024/07/04/technology/openai-hack.html?utm_source=www.therundown.ai&utm_medium=newsletter&utm_campaign=openai-s-secret-hack-exposed

Özet: Şanghay'da bu hafta sonu gerçekleşen Dünya Yapay Zeka Konferansı'nda (WAIC), Çinli şirketler, ABD'nin gelişmiş çiplere uyguladığı yaptırımlara rağmen, LLM'ler, robotik ve diğer AI ürünlerinde önemli ilerlemeler sergiledi.

Detaylar:

SenseTime, etkinlikte SenseNova 5.5'i tanıttı ve modelin 8 ana metrikten 5'inde GPT-4'ü geride bıraktığını iddia etti.
Şirket ayrıca ses, metin, görüntü ve video işleyebilen gerçek zamanlı çok modlu model SenseNova 5o'yu piyasaya sürdü.
Alibaba'nın bulut birimi, açık kaynak Tongyi Qianwen modellerinin indirme sayısının sadece iki ayda 20 milyonu aştığını bildirdi.
iFlytek, birden fazla alanda GPT-4 Turbo'yu geçen gelişmeleri öne çıkaran SparkDesk V4.0'ı tanıttı.
Moore Threads, NVIDIA'nın kısıtlı A100'ünün performansının %60'ını sağlayan GPU'lara sahip bir AI veri merkezi çözümü olan KUAE'yi sergiledi.

Neden önemli: Eğer Çin'in AI firmaları ABD'nin yaptırımlarıyla yavaşlatılıyorsa, bunu kesinlikle göstermiyorlar. Modeller ve teknoloji, piyasadaki liderlerle rekabet etmeye devam ediyor — ve yaptırımlar engeller yaratmış olsa da, bu durum Çinli yenilikçiliği rekabetçi kalmak için çözümler üretmeye teşvik etmiş olabilir.

https://www.scmp.com/tech/big-tech/article/3269387/chinas-ai-competition-deepens-sensetime-alibaba-claim-progress-ai-show?utm_source=www.therundown.ai&utm_medium=newsletter&utm_campaign=openai-s-secret-hack-exposed

Özet: OpenAI Startup Fund ve Thrive Global, kullanıcıların kişisel davranış değişikliklerini yönlendirmelerine yardımcı olacak hiper kişiselleştirilmiş, çok modlu AI destekli sağlık koçu geliştiren yeni girişim Thrive AI Health'i duyurdu.

Detaylar:

AI koçu, beş ana alana odaklanacak: uyku, beslenme, fitness, stres yönetimi ve sosyal bağlantı.
Thrive AI Health, bilimsel araştırmalar, biyometrik veriler ve bireysel tercihleri eğiterek kullanıcıya özel öneriler sunacak.
Thrive AI Health'in CEO'su olarak, daha önce Google'da AI, sağlık ve fitness deneyimleri üzerinde çalışan ürün lideri DeCarlos Love göreve başladı.
OpenAI CEO'su Sam Altman ve Thrive Global kurucusu Ariana Huffington, TIME'da AI'nın hem sağlığı hem de yaşam sürelerini iyileştirme potansiyelini detaylandıran bir makale yayınladı.

Neden önemli: Kronik hastalıklar ve sağlık maliyetlerinin artmasıyla, AI destekli kişiselleştirilmiş koçluk büyük bir değişim yaratabilir — herkesin verilerini sağlık kazançları için kullanabilme yeteneği sunarak. Ayrıca, Altman'ın şirketler ve ortaklardan oluşan ağı, büyük bir AI sağlık gücü oluşturmak için mükemmel bir şekilde uyum sağlıyor.

https://www.prnewswire.com/news-releases/openai-startup-fund--arianna-huffingtons-thrive-global-create-new-company-thrive-ai-health-to-launch-hyper-personalized-ai-health-coach-302190536.html?utm_source=www.therundown.ai&utm_medium=newsletter&utm_campaign=openai-s-hyper-personalized-ai-health-coach

Özet: Microsoft, OpenAI'nin Yönetim Kurulu'ndaki gözlemci rolünden çekilirken, Apple'ın benzer bir pozisyonu almaktan vazgeçtiği bildirildi — bu hamleler, AI sektöründe düzenleyici denetimlerin devam ettiği bir dönemde gerçekleşti.

Detaylar:

Microsoft, Kasım 2023'teki yönetim kurulu olayları sonrasında kazandığı oy hakkı olmayan gözlemci koltuğundan çekilme kararı aldı ve şirketin yeni yönelimine olan güvenini dile getirdi.
Haziran ayındaki ortaklık duyurusundan sonra yönetim kuruluna katılması beklenen Apple, artık gözlemci rolünü üstlenmeyecek.
Bu hamleler, ABD ve AB'deki rekabet yetkililerinin büyük teknoloji şirketleri ile AI startup'ları arasındaki ortaklıklar üzerine yürüttüğü soruşturmalar ilerledikçe geldi.
Microsoft, OpenAI'nin hala "en değerli ortaklarından biri" olduğunu vurgularken, OpenAI ise yönetim kuruluna olan güven oylarından "minnettar" olduklarını belirtti.

Neden önemli: OpenAI'nin Yönetim Kurulu konusunda hiçbir zaman sıkıcı an geçmiyor. Şirketler açıklamalarında olumlu görünse de, Microsoft'un AI deviyle ilişkisi bir süredir durgun hissediliyordu. Rekabet sorunları etrafında artan belirsizliklerle birlikte, bu hamleler yönetim kurulunun yönlendirmesine olan güvenden ziyade daha çok düzenleyici odaklı gibi görünüyor.

https://www.bloomberg.com/news/articles/2024-07-10/microsoft-quits-openai-board-after-antitrust-scrutiny-grows?utm_source=www.therundown.ai&utm_medium=newsletter&utm_campaign=microsoft-and-apple-drop-openai-board-seats

Özet: Google DeepMind, Gemini 1.5 Pro'nun büyük bağlam penceresini kullanarak robot navigasyonu üzerine yeni araştırmalar yayınladı, bu sayede robotların insan talimatlarından karmaşık ortamları anlamasını ve navige etmesini sağlıyor.

Detaylar:

DeepMind'in "Mobility VLA" (Kolaylık VLA), Gemini'nin 1 milyon tokenlik bağlamını harita benzeri alan temsiliyle birleştirerek güçlü navigasyon çerçeveleri oluşturuyor.
Robotlar önce bir ortamın video turunu alırken, önemli konumlar sözlü olarak vurgulanır — ardından video karelerini kullanarak mekanın bir grafını oluştururlar.
Testlerde, robotlar harita eskizleri, sesli istekler ve oyuncak kutusu gibi görsel ipuçları da dahil olmak üzere çoklu modal talimatlara yanıt verdiler.
Sistem ayrıca "bana çizim yapacak bir yere götür" gibi doğal dil komutlarına da izin verir; robot kullanıcıları uygun yerlere yönlendirir.

Neden önemli: Robotlara çoklu modal yetenekler ve büyük bağlam pencereleri sağlamak, çılgın kullanım senaryolarını mümkün kılmak demektir. Google'ın 'Project Astra' demosu, gelecekte görebilen, duyabilen ve düşünebilen ses asistanları için nelerin mümkün olduğunu gösteriyor — ancak bu işlevleri bir robota entegre etmek işleri başka bir seviyeye taşıyor.

https://arxiv.org/pdf/2407.07775v1?utm_source=www.therundown.ai&utm_medium=newsletter&utm_campaign=gemini-1-5-pro-gets-a-body

Mark Zuckerberg, YouTuber Kane Kallaway ile yaptığı röportajda Meta'nın (eskiden Facebook) AI'ye yaklaşımının diğer teknoloji şirketlerinden farklı olduğunu vurguladı. İşte onun yorumlarına dayanarak ana noktalar:

"Tek Gerçek AI" Kavramından Kaçınma: Zuckerberg, tek bir, her şeyi kapsayan bir AI yaratma fikrine karşı olduğunu belirtti. Bu fikrin neredeyse bir tanrı yaratmak gibi algılanabileceğini düşündüğünü ve bu yaklaşımın Meta'nın hedefleriyle uyumlu olmadığını ifade etti.
Özel Amaçlar için Çeşitli AI Araçları: Tek bir, her şeyi yapabilen AI yerine, Meta farklı amaçlar için özel olarak tasarlanmış çok sayıda AI aracı geliştiriyor. Bu yaklaşım, Meta'nın farklı ihtiyaçları ve uygulamaları tek bir varlıkta toplamadan karşılamasına olanak tanıyor.
Mevcut AI Gelişmelerini Kabul Etme: Zuckerberg, Google'ın Gemini AI ve OpenAI'nin ChatGPT gibi güçlü AI sistemlerine atıfta bulunarak bu trendin varlığını kabul etti. Ancak Meta'nın stratejisinin, tek bir baskın AI yerine çeşitli özelleştirilmiş AI araçlarına odaklandığını öne sürdü.
AI Asistanının Korunması: Farklılaştırılmış AI yaklaşımını savunmasına rağmen, Zuckerberg Meta'nın kendi AI asistanını sürdüreceğini ve kullanıma sunacağını belirtti. Bu, Meta'nın AI araçlarını genişletirken, kullanıcılarına kapsamlı AI destekli hizmetler sunmanın önemini anladığını gösteriyor.

Özetle, Meta'nın AI'ye yaklaşımı tek bir baskın AI oluşturma fikrinden ayrılıyor. Bunun yerine, farklı işlevler ve uygulamalar için özelleştirilmiş çeşitli AI araçları geliştirmeye odaklanıyor, ancak mevcut AI asistan yeteneklerini de sürdürüyor.

https://www.hindustantimes.com/business/mark-zuckerberg-says-ai-competitors-try-to-create-god-instead-of-diverse-useful-tools-101719652592935.html

Yazar