İlk kez, makine öğrenimi, insanların kaçırdığı matematiksel bağlantıları tespit etti. Londra merkezli AI güç merkezi DeepMind'deki araştırmacılar, biri düğüm teorisinde ve diğeri simetri çalışmasında olmak üzere iki ayrı problemin üstesinden gelmek için matematikçilerle birlikte çalıştı. Her iki durumda da, AI teknikleri, araştırmacıların daha sonra geleneksel yöntemlerle araştırılabilecek yeni modeller keşfetmesine yardımcı oldu.
Yazarlar, önde gelen bilim dergisi Nature'un 2 Aralık sayısında yayınlanan bir makalede açıklanan yaklaşımın, büyük veri kümelerini içeren diğer matematik alanlarına fayda sağlayabileceğini söylüyor.
MATEMATİK, MAKİNEYE KARŞI
Matematik işbirliği fikri, 2019'da Avustralya'daki Sidney Üniversitesi'nden matematikçi Geordie Williamson ile DeepMind'in CEO'su sinirbilimci Demis Hassabis arasında geçen sıradan bir konuşmayla ateşlendi. Her ikisi de düğüm teorisyeni olan Lackenby ve Oxford'dan bir meslektaşı olan András Juhász kısa süre sonra projeye katıldı.
DeepMind'ın yapay zekasını kullanarak onu 40 yıldır çözülmemiş olan Kazhdan-Lusztig polinomları hakkında eski bir varsayımı kanıtlamaya yaklaştırdı .
Başlangıçta, çalışma DeepMind teknolojisi kullanılarak 40 yıldır çözülmemiş olan matematiksel problemleri belirlemeye odaklandı. Makine öğrenimi, bilgisayarların büyük veri kümeleriyle beslenmesini ve bir güvenlik kamerası görüntüsünü bir fotoğraf veri tabanından bilinen bir yüzle eşleştirmek gibi tahminlerde bulunmasını sağlar. Ancak yanıtları doğası gereği olasılıklıdır ve matematiksel kanıtlar kesinlik gerektirir.
Ancak ekip, makine öğreniminin iki tür nesne arasındaki ilişki gibi kalıpları tespit etmeye yardımcı olabileceğini düşündü. Matematikçiler daha sonra varsayım dedikleri şeyi formüle ederek ve ardından bu ifadeyi kesinliğe dönüştüren kesin bir kanıt yazmaya çalışarak kesin ilişkiyi çözmeye çalışabilirler.
Makine öğrenimi, üzerinde çalışılacak çok sayıda veri gerektirdiğinden, bir gereksinim, çok sayıda nesne için özellikleri hesaplayabilmekti: Düğümler söz konusu olduğunda, ekip, milyonlarca farklı düğüm için değişmezler olarak adlandırılan birkaç özelliği hesapladı.
Araştırmacılar daha sonra, iki özelliği birbirine bağlayan bir model bulmak için hangi AI tekniğinin en yararlı olacağını bulmaya başladılar. Özellikle belirginlik haritaları adı verilen bir tekniğin özellikle yararlı olduğu ortaya çıktı. Bir görüntünün hangi bölümlerinin en alakalı bilgileri taşıdığını belirlemek için genellikle bilgisayarla görmede kullanılır. Belirginlik haritaları, birbiriyle bağlantılı olması muhtemel düğüm özelliklerine işaret etti ve test edilebilecek her durumda doğru görünen bir formül üretti. Lackenby ve Juhász daha sonra formülün çok büyük bir düğüm sınıfına 2 uygulandığına dair kesin bir kanıt sağladılar .
Düğüm kuramcısı Mark Brittenham, "Yazarların bu değişmezlerin birbiriyle ilişkili olduğunu ve dikkat çekici biçimde doğrudan bir şekilde kanıtlamış olması, bu alanda henüz tam olarak anlamadığımız çok temel bir şey olduğunu bize gösteriyor" diyor. Brittenham, makine öğreniminin düğüm teorisinde daha önce kullanılmış olmasına rağmen, yazarların tekniğinin şaşırtıcı bağlantıları keşfetme yeteneği açısından yeni olduğunu ekliyor.
SİMETRİLERİ ÇÖZME
Williamson, simetrilerle ilgili ayrı bir soruna odaklandı. Sonlu nesne kümeleri arasında geçiş yapan simetriler, matematiğin çeşitli dallarında önemli bir role sahiptir ve matematikçiler, grafikler (binlerce düğümü birbirine bağlayan büyük soyut ağlar) ve polinom adı verilen cebirsel ifadeler de dahil olmak üzere çeşitli araçlar kullanarak uzun süredir üzerinde çalışıyorlar. Williamson, onlarca yıldır araştırmacıların ağlardan polinomları hesaplamanın mümkün olabileceğinden şüpheleniyorlardı, ancak bunun nasıl yapılacağını tahmin etmenin umutsuz bir iş gibi göründüğünü söylüyor. "Çok hızlı bir şekilde, grafik insan kavrayışının ötesine geçiyor."
Bilgisayarın yardımıyla, o ve ekibin geri kalanı, grafiği daha küçük, daha yönetilebilir parçalara ayırmanın mümkün olduğunu fark ettiler; bunlardan biri daha yüksek boyutlu bir küp yapısına sahip. Bu, Williamson'a ilk kez üzerinde çalışması için sağlam bir varsayım sağladı.
Williamson, “Bu şeyin ne kadar güçlü olduğu beni çok şaşırttı” diyor. Algoritma bir örüntü üzerinde sıfırlandığında, aynı simetrilerden hangi grafiklerin ve polinomların geldiğini çok kesin bir şekilde tahmin edebildi. "Modellerin doğruluğu ne kadar çabuk elde ediliyordu - bu benim için şok ediciydi. Sanırım temelde bir yılı karanlıkta, bilgisayarların benim bilmediğim bir şeyi bildiğini hissederek geçirdim" diyor.
Williamson'ın varsayımının doğru olup olmayacağı hala açık bir soru. Matematik topluluğunun varsayımları çözmesi bazen uzun zaman alabilir, ancak tüm alanları şekillendirmeye yardımcı olabilirler.
DAHA GENİŞ UYGULAMALAR
DeepMind'da bir bilgisayar bilimcisi olan Alex Davies, proje boyunca araştırmacıların AI tekniklerini iki farklı matematik problemine uyarlamak zorunda kaldıklarını söylüyor. “Başlangıçta bunların en kullanışlı teknikler olmasını beklemiyorduk” diyor.
Juhász, "Yeterince büyük veri kümelerinin oluşturulabileceği herhangi bir matematik alanı bu yaklaşımdan yararlanabilir" diyor ve gösterdikleri tekniklerin biyoloji veya ekonomi gibi alanlarda da uygulamalar bulabileceğini ekliyor.
İsrail, Tel Aviv Üniversitesi'nde makine öğrenimini kullanan bir matematikçi olan Adam Zsolt Wagner, yazarların yöntemlerinin belirli problem türleri için değerli olabileceğini söylüyor. "Bu araç olmadan, matematikçi, sonunda yanlış olduğu ortaya çıkacak bir formül veya teoremi kanıtlamak için haftalar veya aylar harcayabilir" diyor, ancak etkisinin ne kadar geniş olacağının belirsiz olduğunu da ekliyor.
Weeks, “Kişisel tahminim, bilgisayar tarafından oluşturulan varsayımların 'ayrıntıları doldurmada' her zamankinden daha kullanışlı hale geleceği. Ancak asla insan sezgisi ve yaratıcılığının yerini almayacak” diyor.