Yeni başlayanlar, DeepFakes’in güçlü, çığır açan AI’sını ticarileştirmek için acele ediyorlar

0
165
views
Yeni başlayanlar, DeepFakes’in güçlü, çığır açan AI’sını ticarileştirmek için acele ediyorlar
Banggood WW

Bir yıldan biraz daha uzun bir süre önce Deepfakes adlı isimsiz bir Reddit kullanıcısı  interneti değiştirdi .

2018’in başlarında, herhangi bir videodaki bir kişinin yüzünü başka bir yüzle değiştirebilecek bir makine öğrenme modeli yüklediler. Birkaç hafta içinde, düşük tanınmış ünlü takaslı porno, web’de yaygınlaştı. Reddit kısa sürede Deepfakes’i yasakladı, ancak teknoloji zaten internette kök salmıştı – ve bazen kalite daha inandırıcıydı. Her gün insanlar, Prenses Leia’nın yüzünü  The Force Awakens’a ekleyerek daha iyi bir iş çıkardıklarını gösterdi.  Hollywood’un özel efekt stüdyosu Industrial Light and Magic’in yaptığı gibi. Deepfakes aniden herkesin karmaşık makine öğrenmesine hakim olmasını sağladı; modeli eğitmek için bir kişinin yeterli fotoğrafını toplamaya zamana ihtiyacın vardı. Bu görüntüleri bir klasöre sürüklediniz ve araç ikna edici sahteciliği oradan ele aldı. Anonim kullanıcı, özel efekt efsanesinin  geçen yıl bana anlattığı gibi, “gerçek olana dair bir savaş” başlattı  .

Şimdi, kabaca 12 ay sonra, Deepfakes inatçı olduğunu kanıtlıyor. Yeni bir şirketler dalgası, benzer teknolojiler üzerinde para kazanmaya çalışıyor; makine öğrenmelerinden medyada benzeri görülmemiş şeyler yapmaktan – sahte seslerden, sahte avatarlardan, çok detaylı fotoğraflara sahte olmaktan yararlanıyor. Her biri ticari uygulamalar geliştirmek için çalışan bu firmaların üçündeki insanlarla konuştum. Yazılımları için sürdürülebilir bir iş modeli bulmaya ek olarak, her biri bu yeni ortaya çıkmakta olan teknolojinin gücü ve toplumu kendi araçlarından korumak yerine nasıl koruyacaklarını dikkate almalıdır.

Topaz Labs’in web sitesinden Gigapixel AI’nın geliştirme kalitesinde bir demo. [Ekran görüntüsü:  Topaz Labs ]

Sahte DETAYLAR

Parfum Mekani TR

On yıldan uzun bir süredir, oğul-baba ekibi Eric ve Albert Yang, Adobe’nin After Effects gibi yazılımlar için eklentilerle birlikte çeşitli bağımsız görüntü düzenleme araçları oluşturan Topaz Labs adlı küçük ama başarılı bir yazılım firması işletiyorlar  . Yıllarca kendi algoritmalarını geliştirmek, görüntü geliştirmek için doktora araştırmacılarını işe alarak, yazılımlarını oluşturmak için zahmetli, çok özel çalışmalar yapmak için harcadılar – bu da videodan olağanüstü keskin görüntüler çekebilir veya hareketli bir görüntüye elektrik ışıması ekleyebilir.

Sonra makine öğrenimi devrimi gerçekleşti. Birden bire sinir ağlarını keskinleştirme görüntülerini zorlaştırmak için eğitebilirler: “En büyük sürprizlerimizden biri. . . 10 yıllık sıkı çalışmamızı hemen atıp atabileceğimizi görüyoruz. ”Böylece, geçen yıl boyunca stüdyo kendini makine öğrenmesi etrafında yeniden inşa etti. Eric, “Neredeyse yeni bir başlangıç ​​gibi” diyor.

Gürültünün azaltılmasından basit bir JPEG’in düzenlenebilir bir RAW görüntüsüne dönüştürülmesine kadar herşeye izin veren şirketin yeni AI destekli yazılım paketi, bu yıl% 50 gelir artışı sağlayacağı tahmin ediliyor. Onun p IECE de ré sis tance  Gigapixel AI, temelde bir araçtır  “İYİLEŞTİRME!” Meme gerçek hayatta: Çok düşük çözünürlüklü bir görüntü çekmenizi ve% 600 daha büyük olmanızı sağlar. Orijinal görüntünün içindeki her piksel 2 milyon ayrı işlemle analiz edilir ve optimize edilir; böylece çoğu fotoğrafta on binlerce görüntünün nasıl tek tek olduğunu anlamak için eğitilmiş AI sayesinde bir iPhone fotoğrafının 80 inçlik bir baskı olmasına olanak tanır. pikseller genellikle birbirlerine bakarlar. O kadar iyi çalışıyor ki, Topaz Laboratuarlarının en büyük zorluklarından biri müşterileri sitedeki örneklerin gerçek olduğuna ikna etmek.

Gigapixel AI, manzaraları ve manzaraları iyileştirmede gerçekten çok iyi; bu yüzden fotoğraflardaki insanlara ayrıntı eklemek konusunda oldukça kötü, çünkü bir yüzün nasıl  görünmesi gerektiğini bilmiyor  . Yine de, Topaz’ın iyi bildiği bir şeylere inandırıcı sahte görüntüler yaratabiliyorsa, yazılım başka şekillerde kötüye kullanılabilir. Bazı polis makamları, daha iyi tanımlamak (ve biletlemek) için plakaları geliştirmek üzere eski, AI olmayan yazılım parçalarından birini uygulamıştır. Şirketin AI yazılımı aslında yeni pikseller ürettiğinden, AI’nın “yanlış” pikselleri tahmin etmesinin teorik olarak mümkün olduğunu, belki de bu şekilde kullanılmışsa bir plakanın yanlış bir rakam veya harf alabileceği anlamına geldiğini kabul eder.

“Bildiğiniz gibi makine öğrenmesi gerçek detayları bilmiyor. Ayrıntıyı yeniden yaratır. Açıkçası bu sorunlu ”diyor Albert. “Teknoloji geliştikçe daha fazla düşünmek zorundayız. Şu andaki veriler, birisinin yanlış bir plakadan yanlış tanımlanmasından endişe duyduğumuz düzeyde değil, çünkü yazılım numarası üretti. ”Fakat olabilir.

Şimdilik Topaz, teknolojisini fotoğrafçılara pazarlayarak ve yetkililer gibi başkalarına sınırlamaları hakkında bilgi vererek, yazılımın kullanımını kontrol etmeye çalışıyor. Albert, “Şu anda güvenlik uygulama alanına girmiyoruz” diye ekliyor.

AI’yı modüle et. [Ekran görüntüsü:  modulate.ai ]

Sahte sesler

Mike Pappas, odasında bir beyaz tahta üzerinde çalışan birini gördüğünde, MIT’deki yurdundaki koridorda yürüyordu. Bu, bir fizik öğrencisi olan Carter Huffman ve gelecekteki Modulate  CTO’suydu . 2018 yılında kurulan ve Harmonix’in kurucuları ( Guitar Hero’yu duymuş) gibi sesli yenilikçilerden 2 milyon dolar kaynak  sağlayarak, Modulate konuşması dışında Deepfakes’e benzer bir şey yapar: Sesini başkalarının sesine çevirmeni sağlar. Modulate sitesinde, biraz şaşırırsa, Barack Obama’nın demosunun kendisinin yazılımı geliştirdiği konusunda ikna edici bir özelliği var.

Modulate fikri 2015 yılında doğdu. Huffman, stil aktarımı adı verilen bu yeni olguya rastlamıştı  – bir sanat eserinin tarzını diğerine uygulayarak fotoğrafın  Van Gogh resmi gibi görünmesini sağladı . İkna edici sahtecilik oluşturmak için kullanılan eğitim makineleri konusunda, Deepfakes’e stil kuzeni olarak düşünebilirsiniz. Pappas, “Carter okuyordu ve sesi bir görüntü, bir spektrogram olarak kaydedebildiğiniz ve bu sesle görüntü stili aktarımı yapmayı denemenin ne olacağını merak ettiğimizi düşündüm” dedi. “Denemeler kurdu ve acil cevap tam çöp gibi geldi.”

Ancak üç yıl sonra iyileşme, Modulate oldukça iyiye gitti. Yazılım, birinin sesinin birçok örneği üzerinde bir model eğiterek çalışır. Bu saatler boyunca saatlerce ses kaydı yapan halka açık rakamların kimliğe bürünme hedeflerini kolaylaştırdığı anlamına gelir. Teorik olarak, Modulate içerisindeki teknolojiyi bir politikacılar, ünlüler veya konuşmaya çok zaman harcayan bir model oluşturmak için kullanabilir ve ardından bilgisayarı dilediğiniz zaman kendi sesleriyle konuşmak için kullanabilirsiniz.

Ancak Pappas, politikacıları veya ünlüleri taklit etmek için kullanılan Modulate’le ilgilenmiyor. Pappas, “Obama sesi web sitemizde çünkü bir kişiyi veya karakteri nasıl eşleştirebileceğimizi göstermenin önemli olduğunu düşündük ve çok fazla kamuya açık sesin mevcut olduğunu düşünüyoruz, bu yüzden kolaydı,” diyor Pappas. “Barack Obama gibi ses çıkarmanın hoş olacağını söyleyen bazı insanlar var – belki bir iki dakikalığına.” Yani Obama filtresi aslında mevcut değil.

Bunun yerine, Modulate teknolojisini sosyal medya ve oyun şirketlerine lisanslamak istiyor ve bu platformlarda havalı bir ses avatarına sahip olmanıza izin veriyor. Ses, sizin gibi ses için sizin tarafınızdan eğitilmeyecekti, ancak geliştiriciler tarafından bir karakter gibi ses çıkarması için, göreceli olarak sıkı kontrol altında olacaktı. Overwatch gibi bir oyunda asıl ses aktörünün seslerinden biriyle konuşabiliyorken neden arabanız gibi geliyor  ?

“En anlamlı acil uygulama, tüketicilerin çevrimiçi olmalarını, çevrimiçi kişilerini tasarlamalarını sağlamaktır. Karakterleri için yeni arayüzlere para harcıyorlar, ancak sesli sohbeti kullanır kullanmaz. . . kendi seslerini kullanmak zorunda oldukları için ürettikleri yanılsamayı kırıyorlar ”diyor. “Onlara karakterlerinin içine tamamen girme özgürlüğü verin.”

Bununla birlikte, Pappas, Modulate’in ünlü sesleri içerebileceğini inkar etmiyor. O işaret  Fortnite  geçenlerde satın alma için NFL görsel derileri vardı ve belki bazı oyuncular da oyuna kendi seslerini ödünç isterim. Ancak Modulate, bu konuda erken dolandırıcılığı nasıl çözebileceğini düşündü. Çıplak kulağa duyulamamasına rağmen, dalga biçimine bakıldığında kolayca tespit edilebildiği tüm kayıtlarının içine bir ses parmak izi içerir. Böyle bir parmak izi viral olmadan önce hızlı bir şekilde sahte haberleri durdurmak için yeterli olmazdı. Fakat en azından ünlü bir kişinin tartışmalı bir şey söylediğini ispatlamak için kullanılabilir.

Yine de, kusurlu bir güvenlik önlemi ve şirket için süregelen bir odaklanma. “Orada çok sofistike ses mühendisleri var. Bir gün bu filigranları düzenlemeleri mümkün olabilir ”diyor Pappas. “Bu yüzden çalışmamızın bir kısmı filigranı sesin içine daha derin bir şekilde sokmak için yeni yollar bulmakta. Bu yüzden filigranları sağlam kılmak için yeni makine öğrenme araştırmaları yapıyoruz. ”

[Kaynak fotoğraf: Luke Braswell / Unsplash ]

Sahte Gövde

Misha Leybovich her zaman bir astronot olmayı hayal eder. Lisans mühendisliği derecesi için UC Berkeley’e gider, daha sonra teknoloji politikası ve havacılık mühendisliği alanında yüksek lisans derecesi almak için MIT’ye gider. Hiç kimse ona yetişkinlerin çoğunun aslında astronot olmadıklarını, şaka yaptıklarını söylemedi – bunun yerine McKinsey danışmanlığına indi, sadece kendi başlangıcını bulmak için kaşıntıya başladı.

Platformu,  Meo , yapımında üç yıl olmuştur. Meo’nun hilesi, birinin yüzünün 2B videosunu çekip bunu bir 3B avatarına dönüştürebilmesidir. Bu avatar bir ejderha veya yavru kedi olabilir, ancak duygusal durumunuzu – benzersiz mikro ifadelerinizi, ince bir gülümseme veya kaşıntı gibi – Apple’ın animojisinin yapmadığı bir şekilde iletebilir. Finansman alanında 2,5 dolar biriktiren Meo, şu anda oyun oynamaya dahil olmak için video oyun endüstrisine çevrilebilecek kadar iyiye gitti.

Leybovich, Meo’nun sonunda bir oyundan sosyal ağa, bir güzellik uygulamasına kadar her şey için kendinizi derinleştirmenize izin vereceğini düşünüyor. Yüzbinlerce, içinizden fotoğrafların hatta milyonlarca bilgilerini alarak, Meo öyle gibi görünmesi olabilir  sizi  arkadaşının kale fırtınası olduğunu, yoksa yeni göz kalemi yüzünüzde nasıl görüneceğini görmenize yardımcı olabilir. Leybovich, “Günün sonunda, yarattığın 3 boyutlu bir modelin olduğunda, onunla her şeyi yapabilirsin” diyor.

Leybovich, kendi yüzünüzden başka bir kaynaktan bir 3B model oluşturmak için sistemi kötüye kullanabileceğinizi kabul ediyor. “Sonunda bir ünlüyü veya başka bir şeyi taklit edebileceksiniz” diyor. Belki de telefonunuzu oyun oynayan bir Twitch video oynatıcısının videolarına yönlendirebilir ve onlara göre bir avatar yaratabilirsiniz. Ya da belki ciddi bir sahtekarlık için gitmiyorsun. Belki sadece biraz yalan söylüyorsun, görünüşünü değiştirmek için teorik Instagram filtrelerini kullanarak – birkaç kas ekleyerek, daha düz bir cilt ya da yaşını ve cinsiyetini değiştiriyorsun. Leybovich, videonun sadece doğa tarafından inanılır olduğunu kabul ettiği için kötüye kullanım için gerçek bir ihtimal olabileceğini itiraf ediyor. Bir yetişkin ikna edici bir şekilde çocuk olarak poz verebilir. Kıskanç bir eski yeni bir talipmiş gibi görünebilir.

Leybovich, “Herhangi bir iyi teknoloji [şirket], çalışmalarının kötülük değil iyilik için kullanılmasını ümit ediyor” diyor. “İleriyi düşünmeye ve teknolojimize karşı korumalar geliştirmeye çalışıyoruz.”

Meo için, koruma potansiyeli mükemmeldir ve herhangi bir umuduyla diğer hizmetlerin taklit edilmesi için bir model olabilir. Geliştiricilerin Meo’yu dahil etmek için kullanmaları gereken SDK’sı içinde, firma gerçek bir skor ve canlı bir skor olarak adlandırdıklarını da içeriyor. Gerçek puan, modelinizi çekirdek yüz şeklinizden ne kadar değiştirdiğinizi gösteriyor. Burnunu biraz küçült, belki de% 85’lik gerçek bir puan alırsın. Kendinizi 80 yaşında bir elf haline getirin ve belki de% 25’lik gerçek bir puan alırsınız. Canlı skor, Meo’nun avatarınızın gerçek yüzünüzden önceden kaydedilmiş bir şeye karşı geldiğinden ne kadar emin olduğunu gösteriyor. Bu puanları uygulamalarına nasıl dahil edeceğine karar vermek geliştiriciye kalmıştır, ancak hızlı bir şekilde gerçek bir kontrol için tıklanabilecek birisinin profil sayfasında yayınlanması muhtemel görünmektedir.

Leybovich, “Sadece şeffaf olmalı” diyor. “Sektörün gerçek bir skor ve canlı bir skor benimsemesini sağlayabilir miyiz? Hayır, biz sadece bir şirketiz. Biz düzenleyici değiliz. Ancak şu anda lider olduğumuz ve başarılı olabileceğimiz ve davulları yendiğimiz göz önüne alındığında, umarım bir standart oluşturabilir ve belki de herkesi de bunu yaparak utandırabiliriz. ”

Deepfakes, kamuya açık araştırmalardan özgür yazılımlar yarattıklarında medya manipülasyonunda bir devrim yarattı. Makine öğreniminin kimlikleri nasıl taklit edebileceği hakkındaki bilgi dışarıdaydı ve fark edilebilir bir uygulamaya dönüştürdüler. Ancak bu yeni şirketler benzer medya manipülasyon teknolojisini ticarileştirmenin ya da bir kişiyi veya yeri taklit etmek için bir makineyi eğitmek için binlerce fotoğraf veya ses dosyası kullanmanın bazı pratik yararları olabileceğini göstermektedir. Görüntü, video ve konuşmayı manipüle etmek için AI kullanmak isteyen şirketler rastgele Redditors’dan (en azından teoride) daha yüksek standartlarda tutulacak. Başka bir şey olmazsa, bu şirketler bir kar edinmeleri gerektiğini biliyorlar. Bunu yapabilmek için araştırmalarını özel tutmaları ve sömürünün en bariz yollarını sınırlamaları gerekiyor.

“Kısmen iyi bir vatandaş olmak istiyor. Eminim ki kendi kendine hizmet ediyordur ”diyor Leybovich. “Günün sonunda, Facebook’un Parlamentonun önünde çekilmemesini istediğinden eminim. İş veya toplum için iyi değil. Bu sadece doğru yapmaya çalışmak değil, ama sonuçta, eğer insanlar eşyalarını kötüye kullanıyorsa, işinizde bir sorun var. Bunu önlemeye çalışmak daha iyi. ”

GearBest TR

CEVAP VER

Please enter your comment!
Please enter your name here