DeepSeek ve düşündürdükleri

Dr. Uğur TANDOĞAN
Dr. Uğur TANDOĞAN NOT DEFTERİ

Bir anı

Unutamadığım anılardan biridir. Bir bilimsel ve teknik kitaplar yayınevi, Northwestern Üniversitesi’nde kitap sergisi açmıştı. Sergi, Technological Institute  binasının giriş holünde idi. Derse girmeden önce ben de kitaplara baktım. Kitaplar dört beş masa üstüne konulmuştu. Bir şey dikkatimi çekti. Uçtaki masanın kenarında bir Çinli oturmuş bir şeyler yazıyordu. Herhalde satın alacağı kitaplar için not alıyor diye düşündüm. Merakla yanından geçtim. Yazdığı, kitap ismi falan değildi. Bu kişi önündeki bilgisayar kitabından notlar alıyordu. Yayınevinin satış temsilcisi ile göz göze geldik, gülümsedi; işin farkında idi.  Sabah derslerine girip çıktım. Öğle yemeğine gitmeden önce merak edip tekrar binanın giriş holüne uzandım. Bizim Çinli hâlâ orda idi; aynı kitaptan not almaya devam ediyordu. Yayınevi temsilcisi ile yine selamlaştık; yine gülümsedi. Akşam giderken baktım,  Çinli yazmaya devam ediyordu.

Ertesi sabah okula geldiğimde yine giriş holünden geçtim. Kitap sergisi orada idi. Gözüm Çinliyi aradı, ama yoktu. Yayınevi temsilcisi “Günaydın” diyerek yanıma geldi. Ben “Bizim Çinli galiba kitabı bitirdi?” dedim. Temsilci “Yok bitirmedi. Serginin sonuna kadar her gün gelecekti. Çünkü hedefinde tüm kitabı yazmak vardı. Sergi sonunda o kitabı kendisine hediye edeceğimi söyleyince not almayı bıraktı. Ama sabahtan yine bir uğradı. “Merak etme kitabı satmayacağım, kitap senin” deyince rahatladı, gitti” dedi.

Bu olay seksenli yılların başında idi. Jimmy Carter ABD Başkanı idi ve Çin ile diplomatik ilişkileri başlatmıştı. Karşılıklı imzalanan bir kültür anlaşması vardı. Bu cümleden olarak Amerikan üniversitelerine Çinli bilim insanları gelmeye başlamıştı. Yukardaki Çinli de bu sınıftan bir bilim adamı idi. Ancak Çin ekonomik anlamda daha kefeni yırtamamıştı. Bu Çinli bilim adamının maaşı sanırım o kitabı almasına olanak tanımıyordu. Ama o bilim aşkı ile kendisine gerekli kitabı baştan sona elle kopya etmeye oturmuştu.

DeepSeek depremi

Sovyetler Birliği 4 Ekim 1957 tarihinde uzaya “Sputnik” adı verilen ilk yapay uyduyu (articial satellite) yolladı. Bu uydu, gümüş ve çinkolu pilleri bitinceye kadar üç hafta boyunca yeryüzüne sinyal yolladı. Bu uydu Sovyet Uzay Araştırmaları Programı’nın bir ürünü idi; hiç beklenilmiyordu. Başta Amerika Birleşik Devletleri olmak üzere tüm batı dünyasında büyük şaşkınlık yarattı. Buna literatürde “Sputnik Krizi” denir. Batı ile doğu arasında büyük bir yarışı tetikledi. Bu yarış; siyasi , askeri, teknoloji ve bilim alanında büyük gelişmelere yol açtı.

Geçtiğimiz günlerde “DeepSeek” isimli bir Çin firması, yeni bir yapay zekâ modeli DeepSeek R1’i tanıttı. Model, yapay zekâ alanında adeta bir deprem yarattı. Öyle bir deprem ki konudan etkilenen teknoloji şirketleri bir günde 1 trilyon dolardan fazla değer kaybetti. Silikon Vadisi duayenlerinden Marc Anresssen bu olay için “Yapay zekânın Sputnik anı” (AI’s Sputnik Moment) terimini kullandı. Sputnik Krizi’nden önce Amerikalılar ve tüm batı dünyası uzay yarışında kendilerini Rusların çok ilerisinde sanıyordu. Ancak Sputnik bunun böyle olmadığını somut şekilde gösterdi. İşte yapay zekâ olayında da böyle oldu.

DeepSeek R1 modeli, işin uzmanlarını çok etkiledi. Çünkü bu yapay zekâ modeli, Amerika’daki milyarlık yapay zekâ modelleri kadar iyi idi. Aynı zamanda rakiplerine göre de ucuz. Aslında ABD hükümeti yapay zekâ alanında Çin ile arasındaki rekabetin farkında idi. Bu yarışta da çiplerin önemini biliyordu. Nvidia gibi çok spesifik, özel amaçlı  çip üreten firmaların satışını kontrol altına almıştı. Bu durum Çinli araştırmacıları, daha düşük özellikli çipleri kullanmaya yöneltti ve bulabildikleri özel nitelikli çipleri de daha ekonomik kullanmaya. Örneğin, Amerikan şirketleri yapay zekâ ile çalışan “sohbet robotlarını” (chatbot)  eğitmek için süperbilgisayarlarda (Supercomputer) özel amaçlı ve çok pahalı 16.000 Nvidia çipi kullanırken bu sayı DeepSeek için 2.000 imiş. (Bu literatürde “Eğitmek” terimi, yapay zeka teknololjilerinin verileri öğrenme biçimini tanımlamak için kullanılmaktadır.)

DeepSeek’in açık kaynak (Open source) yaklaşımı, bu alanda önemli olguyu da destekledi. Amerikan şirketleri arasında sadece Meta (Facebook, Instagram ve Whatsapp’ın sahibi) 2023 yılında üstünde çalıştığı “LIama” adını verdiği yapay zeka modelini açık kaynak olarak piyasaya sürmüştü. Bundan dolayı da Silikon Vadisi’nde çok eleştirilmişti. Ancak Meta şimdi DeepSeek’in başarısını bu “açık kaynak” stratejisinin bir zaferi olarak tanımlıyor. Meta mühendisleri şimdi DeepSeek modelinin getirdiği yenilikleri inceleyerek kendi modellerine uygulamanın yollarını araştırıyormuş. Sıfırdan bir yapay zeka modeli geliştirmek milyarlarca dolara mal olacakken, açık kaynak yaklaşımı “yeni girişimcilere” (Start-ups) mevcudu daha hızlı biçimde geliştirme fırsatı vermektedir. 

Liang Wenfeng kimdir?

DeepSeek şirketinin sahibi ve kurucusu Liang Wenfeng 1985 doğumlu bir Çinli. Bir ilkokul öğretmeninin oğlu. Çin’de Zhejiang Üniversitesi'nde elektrik mühendisliği okumuş, 2006 yılında mezun olmuş. Liang 2007 yılında, bilgi ve iletişim mühendisliği alanında yüksek lisans eğitimine başlamış ve burada bilgisayarlı görü araştırmaları konusunda çalışmış. Liang daha üniversitede öğrenci iken 2008 yılında sınıf arkadaşlarıyla birlikte finansal piyasalar hakkında veri toplamak için bir ekip kurmuş. Ayrıca ekibinin makine öğrenimini (machine learning) kullanarak niceliksel ticaret (quantitative trading) konusunda çalışmasına da liderlik etmiş.

Liang Wenfeng, 2010 yılında üniversiteden yüksek lisans derecesi ile mezun olmuş. Bir süre yapay zekanın değişik alanlarda kullanımı konusunda çalışmış. Ancak çok başarılı olamamış. Mühendislikten iki arkadaşı ile 2016 yılında “Ningbo High-Flyer Quantitative Investment Management Partnership” isimli fon yönetimi firmasını kurmuş. Burada yatırım kararlarında matematik ve yapay zekayı kullanmışlar.

Liang Wenfeng, 2019 yılında “High-Flyer AI” şirketini kurmuş ve araştırmayı yapay zekâ ve onun temel uygulamalarına odaklamış. Bu sırada şirketin yönetimindeki fonların değeri 10 milyar yuanın üstünde imiş.

Liang’ın yönetim felsefesi de alışılmış dışı. "Herkesin kendine özgü bir yaşam öyküsü vardır.  Size bu yaşam öykülerinde kazandıkları fikirleri ile gelirler. Onları zorlamaya gerek yok“ diyerek yaratıcılıkta düşünce özgürlüğünün önemini vurgulamış.  Sırf zorlu yazılım çalışması (kodlama)yanında entellektüel keşiflere de önem veriyormuş. Kadrosunda sıkı yazılım mühendisleri yanında gönlünü edebiyata kaptırmış edebiyat mezunu gençler de varmış. Gençlere olan inancını şöyle ifade ediyor: “Yeni buluş kendine güvenle başlar; bu da en çok gençlerde olur” diyor.

Son söz

DeepSeek haberini  görünce yazıma girişte anlattığım olayı hatırladım. Acaba Liang Wenfeng’in Northwestern Üniversitesi’ndeki o Çinli bilim adamı ile yolları çakıştı mı diye düşündüm. O Çinli’nin bu çabasına Amerikalılar gülmüştü ama ben hayran kalmıştım.

Sonra oturdum son yaşadıklarımızı düşündüm. Dünya bunlarla uğraşırken bizde neler oluyor diye kederlendim. Biz kafalarımızı kuma gömerek düşünceyi  yargılamakla meşgulüz. “Över över, kel oğlan perçemini över” misali kendi kendimize methiyeler düzüyoruz. Öküz mentalitesi ile öküzün altında buzağı arıyoruz. Gençlerin cesaretlerini, coşkularını takdir edecek yerde sindirmeye çabalıyoruz.

Hiçbir şey rastlantı değildir; başarı da başarısızlık da. Sonunda her ulus ektiğini biçer.

Yazara Ait Diğer Yazılar Tüm Yazılar
Nasıl bir yıl olmasın? 31 Aralık 2024
Cesaret 03 Aralık 2024
Saçmalıklar 26 Kasım 2024