ChatGPT ile deneyler

Bilim tarihiyle azıcık ilgilenen herkes deney tasarlamanın ne kadar zor olduğunu bilir. Bundan daha da zor olanı bu deneyin sonuçlarını yorumlamak olabilir.

Benim de herkes gibi kafamda bir ChatGPT tasviri var. Internetteki bilgileri bir şekilde harmanlamış ve bunları iyi cümlelerle paketleyip sunan bir yardımcı. Yalnız kendisiyle yazışırken arada kendimi onunla tartışırken bulduğum da çok oldu. Demek ki içten içe onu düşünen bir varlık olarak da hayal etmek istiyorum. Öyle olmadığını bilsem de. Düşünmenin tanımı ya da sınırları bizim için de çok zor olmalı ama, bu durumda hiç düşünemiyor da diyemem heralde.

Bugün şirketteki işlerim biraz iyi gidince dinlenmek için onunla bir deney yapayım dedim. Standard sorulara çok iyi cevaplar verdiğini biliyordum. Daha geçenlerde yazdığım bir oyun programı için bir algoritma sormuştum ve önerdiği şeyi programlayıp çalıştırınca istediğim gibi çalıştığını görmüştüm. Sorduğum şey de standard bir algoritmaydı ama bu durumda iyi bir yardımcı olduğunu inkar edemem şimdi.

Deney için bilinen bir bilmeceyi aldım ve parametreleri biraz değiştirdim. Böylece sorunun şekli ve çözüm algoritması dışında tam bu sorunun çözümüyle eğitilmiş olamayacaktı. Acaba bu çözüm yolunu bu yeni parametrelere uydurabilecek miydi? Ya da en azından deneyecek miydi?

Şimdi yazışmamıza bir bakalım:

Sorduğum soruyu doğru anladığını düşünüyorum. Yani anlamaktan kastım, kurallarını çözdü ve eğitildiği verilerdeki bazı yöntemlerle benzerlikler bulabildi. Kullandığı algoritmanın sonuçlarını yanlış buldu ama. Bunun çok değişik nedenleri olabilir. Mesela soruyu çözmekten çok giriş, gelişme ve sonuç kısımları olan kısa bir yazı yazma eğilimi olması nedeniyle hemen ilk bir iki sonucu genellemiş olabilir.

Burada ikili arama yöntemini kullanarak bir sonuç buluyor ama tabii ki soruda istenen en iyi çözüm değil bu. Bunu da aramıyor. Yine de bu çözüm denemesi hiç de fena değildi. Çözümleri sonuna kadar getirmediğinden yaptığı çıkarımlar da haliyle hatalı oluyor. Bunun nedenlerini bilemiyorum ama.

Buradaki cevabın ilk paragrafında soruyu çözdü heralde dedim. Cevap doğruydu, ilk adım da doğru ama ondan sonra mantığı uygulamayı beceremedi. Becerememekten de öte, sonraki adımlarda iyice saçmalamaya başladı. Acaba soruyla ilgili bazı şeyleri yanlış mı anladı, yoksa göz ardı etmeye mi başladı bilemiyorum ama beklediğim çözümden birden uzaklaşmaya başladık.

Neyse ki, adımları tek tek deneyince daha iyi bir sonuç bulabildik.

Bu sefer bir önceki çözümde kullandığı yöntemlerin birini (katların artırma kuralını) genellerken diğerini (başlangıç katının önemi) tamamen unuttu. Bunun yanında problemi de iyice unuttu. Birden binaya yeni katlar eklemeye başladı. Binanın kat sayısını hatırlattığımda ise diğer yöntemleri de iyice unuttu ama kafasındaki çözüme uymayan sayıları güzel cümlelerle pazarlamaya kalktı.

Bu kısımda ise daha önceki kısımlarda katettiğimiz her aşamayı kaybettik gibi gözükse de çözümle ilgili bir pırıltıya dikkat çekmek istiyorum. Başlangıç katı olarak 4. katı seçti ve sonra önce 3 sonra iki kat artırdı. Bunlar yanlıs sayılar olsa da doğru çözüm için gerekli mantığa ulaştık. Tabii program bunu mantık olarak gördü mü yoksa sadece bir sürü parametreden birinin rastlantısal bir etkisi miydi bilemiyorum.

Tam belki de doğru yoldayız diye düşünüyordum ki, yine ikili arama yönteminin ününe aldanıp çözümden iyice uzaklaştı.

Son kısımda da demin dediğim şeyi onaylar gibiydi. İkili arama birçok sınırsız sayıda yumurtamız olsa en iyi arama performansını verebilir ama bu problemde sadece iki yumurtamız var. Bu tür mantık yürütmesini beklemiyordum tabii ki ama eğer biraz mantık yürütüyorsa bunu arka arkaya tekrarlayabilir belki diye umuyordum. Yanılıyormuşum. En sonunda ilginç olmayan bir şekilde insani bir tepki verdi ve soruyu çözemeyince çoğunlukla işe yarayacak bir şey önerdi. Bu tür çözümler problemden sıkılan, daha fazla arama yapmak istemeyen insanların en sık başvurduğu çözümler oluyor. Bütün parçaları tek tek bulmuş olsa da hepsini birleştirerek 6 denemelik çözümü yine de bulamadı.

Bu durumda düşünemiyor diyebilir miyim? Çok genel anlamda düşünüyor olabilir ama bizim soyutlama, genelleme yeteneğimizden tabii ki hala çok uzak. Ayrıca bu ChatGPT programının böyle bir amacı var mıydı onu bile bilmiyorum.

Bir olasılık sorusu

Bundan çok uzun yıllar önce ben üniversite sınavına hazırlanırken sorular çok daha sıradandı diye hatırlıyorum. Belki de yapabildiğim için öyle hatırlıyorumdur. Şimdi değişik sosyal medya gruplarında sorulan test sorularına bakınca seviye sanki biraz yükselmiş gibi geliyor bana ama bu sorular sınav soruları değil, çeşitli test kitaplarından alınmış sorular. Hatta aralarında yanlış sorular da oluyor.

Geçen haftalarda iki kere karşılaştığım ama bizim zamanımızda hiç sorulmayan bir olasılık sorusu türünden bahsetmek istiyorum.

Ahmet ve Ayşe akşam 7 ile 8 arasında buluşmak istiyorlar. Buluşma yerine tam kaçta gelecekleri belli değil ama her birinin 7 ile 8 arasında herhangi bir zamanda buluşma yerine gelme şansı eşit. Buluşma yerine erken gelen diğerini en fazla 15 dakika bekleyecek ve bu süre içinde diğeri gelmezse buluşma yerinden ayrılıp eve dönecek. Ahmet ve Ayşe'nin buluşma ihtimali nedir?

Bütün buluşma zamanını 60 dakikaya böleyim ve Ahmet’in buluşma yerine geliş zamanını x ekseninde, Ayşe’nin gelişini de y ekseniyle göstereyim.

x ekseni Ahmet’in gelebileceği dakikalar, y ekseni de Ayşe’nin gelebileceği dakikaları gösteriyor.

Yukarıdaki şekilde iki tane doğru çizdim. Bunlar sorunun çözümü için çok önemli denklemler, daha doğrusu eşitsizlikler. Yukarıdaki doğru y – x < 15 eşitsizliğinin sınırını oluşturan doğru. Bu eşitsizlik Ayşe’nin Ahmet’ten en fazla 15 dakika daha sonra geldiği noktaları gösteriyor ve yukarıda kalan doğrunun altındaki bütün noktaları içeriyor. Alttaki doğru da x – y < 15 eşitsizliğinin sınırı oluyor. Bu eşitsizliği sağlayan noktalar da doğrunun yukarısındaki noktalar. Bu eşitsizliğin anlamı da Ahmet’in Ayşe’den en fazla 15 dakika sonra geldiği durumlardır.

Bu iki doğru arasında kalan koyu mavi alan da Ahmet’in ve Ayşe’nin buluşma yerine en fazla 15 dakika farkla geldiği durumlardır.

Ahmet’le Ayşe’nin buluşma ihtimali böylece koyu mavi alanın bütün alana oranı şeklinde hesaplanabilir.

\(P(buluşma) = \frac{60^2 – 45^2}{60^2} = \frac{7}{16} \)

Başta da dediğim gibi bu tür sorular benim zamanımda sadece bilmece olarak soruluyordu ve sınav seviyesi için zor bir teknik olarak görülüyordu. Anlaşılan artık biraz daha standard bir soru türü olmuş.

Kısaca, bu tür sorularda aktörler için eksenler seçilip o alanda soruda aranan eşitsizlikler yazılır ve istenen alanın tüm alana oranı hesaplanır. Problemin geometrik alanlara dönüştürülmesi olasılıkta sık sık görülen yöntemlerden biridir ve sonunda bizim eğitim sisteminde de beklenen bir şey olmuş ama bunun anlaşılması için derste daha deneysel bir yaklaşım gütmek gerekebilir.