Aynı dizinin bir tamsayı kadar klonlandığını biliyoruz ama bu tamsayıyı bilmiyoruz. Eğer tamsayısı bilseydik bu dizinin kaç simgeden oluştuğunu bulabilirdik. O zaman önce o tamsayıyı bulalım.
Bütün simgeleri sayınca toplam 120 adet simge olduğunu görüyoruz. Demek ki elimizdeki dizinin uzunluğu 120 sayısını bölebilmeli. Eğer 120 sayısını çarpanlara ayırıp bu ihtimallere bakarsak olası uzunlukların 1, 2, 3, 4, 5, 6, 8, 10, 12, 15, 20, 24, 30, 40, 60 ve 120 olduğunu görürüz. Tabii ki bu değerlerin bir kısmının doğru olamayacağını da bir bakışta görebiliyoruz. Yine de denemek için çok fazla sayı var, birazını daha elemeye çalışalım.
Her bir simgeyi tek tek sayalım. Bu durumda şu sonuca ulaşırız:
A = 30 C = 30 G = 25 T = 35
Aradığımız N tamsayısı bu sayıların hepsini bölebilmeli. Demek ki bu dört sayının en büyük ortak bölenini arıyoruz. Şimdi bu sayıları da asal çarpanlarına ayıralım:
A = 30 = 2*3*5 C = 30 = 2*3*5 G = 25 = 5*5 T = 35 = 5*7
Bu tablodan da görüldüğü gibi her sayı için ortak tek asal çarpan 5. Demek ki başlangıçta elimizde 5 dizi vardı, yani aradığımız dizinin uzunluğu 120 / 5 = 24.
Yani dizimizdeki simge dağılımı şu olmalı:
A = 30 / 5 = 6 C = 30 / 5 = 6 G = 25 / 5 = 5 T = 35 / 5 = 7
Şimdi elimizdeki uzun dizilere bakalım.
TAACTGTT (1)
CTGTTCCA (2)
ACTGTTC (3)
ACTTGG (4)
CCAACG (5)
Bu parçaları ikişer ikişer alıp birbirlerinin üzerinde kaydırırsak bazı çiftlerin ortak dizileri olduğunu görürüz ve bazıların olmadığını. Örnek olarak şunlara bakalım:
(1) ve (2) T A A C T G T T (1) C T G T T C C A (2) (3) ve (4) A C T G T T C (3) ... A C T T G G (4) ya da A C T G T T C (3) A C T T G G ... (4)
(3) ve (4) numaralı diziler birbirlerinin önekleri ya da sonekleri şeklinde olmadığından üstüste binen bir dizi parçası yok. Demek ki bu iki parça dizi üstünde farklı yerlerde olmalı. (3) numaralı dizi 7 simge uzunluğunda ve (4) numaralı parça da 6 simge uzunluğunda olduğundan dizimizdeki 13 simgeyi tanımlamış olduk. Henüz bu simgelerin dizi içindeki ve birbirlerine göre yerlerini bilmiyoruz ama.
(3) ve (4) numaralı parçalara bir de (5) numaralı parçayı ekleyelim. Yukarıdaki kaydırma işlemini uygularsak tek çakışmanın (3) numaralı parçayla aşağıdaki şekilde olabileceğini görürüz.
(3) ve (5) A C T G T T C (3) C C A A C G (5)
Bunun sonucu olarak (3) ve (4) numaralı parçalara ek olarak en az 5 simge daha (CAACG) belirlenmiş oldu. Şimdi bu üç parçayı alıp simgeleri sayalım.
ACTGTTC (3) ACTTGG (4) (C)CAACG (5) İlk simge parantez içinde çünkü (3) numaralı parçanın son simgesiyle ortak olabilir. İlk durum olarak birinci C simgesinin ortak olmadığını varsayalım. O zaman aşağıdaki simge dağılımını buluruz. A = 4 C = 6 G = 4 T = 5
Yani bütün C simgeleri bu üç parçadan gelmekte. Ayrıca toplam uzunluk bu durumda 19 simge olduğundan kalan (1) ve (2) numaralı parçalar da bu dizilerle epey örtüşmeli. Bu örtüşmeyi en iyi (3) numaralı parça sağlar. Şimdi böyle bir çözüm bulabilir miyiz diye bakalım. Özellikle C simgesine odaklanalım. (1) numaralı parçanın ortasında bir C simgesi var. Bu simge (3), (4) ya da (5) numaralı parçaların bir C simgesiyle örtüşmeli, aksi bir durumda dizide altıdan daha fazla C simgesi olur. Ayrıca (2) numaralı parçanın sonundaki C simgeleri de yine (3), (4) ya da (5) numaralı parçaların C simgeleriyle örtüşmeli. Burada birkaç deneme yapmamız gerekebilir.
1. deneme: T A A C T G T T (1) C T G T T C C A (2) A C T G T T C (3) A C T T G G (4) C C A A C G (5) T A A C T G T T C C A C T T G G C C A A C G Bu dizilimde 7 tane C simgesi var.
Sorun (2) numaralı parçanın örtülmeyen son C simgesinde. Bunu (4) ve (5) numaralı parçalarla örtmenin bir yolu şöyle olabilir.
2. deneme: T A A C T G T T (1) C T G T T C C A (2) A C T G T T C (3) C C A A C G (5) A C T T G G (4) T A A C T G T T C C A A C G A C T T G G
Bu denemede aynı zamanda (3) ile (4) numaralı parçaların da birer C simgesinin örtüştüğüne dikkat çekmek istiyorum. Başka bir yolla bu ikinci C simgesini örtmenin yolunu bulamadım. Bu şekilde toplamda da 5 tane C simgesi olduğundan biraz daha esneklik kazanmış olabiliriz. Buradaki sorun (4) numaralı parçanın bu büyük parçaya göre pozisyonu ve iki bloğun da ana dizi içindeki yerleri henüz bilmememiz. Elimizdeki alt dizi toplamda 20 simge uzunluğunda ve sadece 4 simgelik yerimiz kaldı.
Şimdi kalan uzun parçalardan birini alalım, mesela
GGTCA (6)
Bu parçanın örtüştüğü tek yer sondaki çift G.
Üçüncü deneme: T A A C T G T T (1) C T G T T C C A (2) A C T G T T C (3) C C A A C G (5) A C T T G G (4) G G T C A (6) T A A C T G T T C C A A C G A C T T G G T C A A = 6 C = 6 G = 4 T = 7
Görüldüğü gibi bu altdizide 24 simge var ve sadece bir tane G eksik. Şimdi kalan parçalardan içinde G olanları bu diziye eklemeye çalışalım.
Bu adımda GGTAA parçası için yerimiz kalmadığını görebiliriz. Demek ki önceki adımlarda başka bir yolu seçmemiz gerekiyor. Bu arada GGTAA parçasını da (7) numaralı parça olarak tanımlayarak ikinci bir küçük problem elde edebiliriz. İlk küçük problemimiz ilk beş parçanın C simgesi ve toplam uzunluk kıstasları üzerinden analiziydi. İkinci küçük problemimiz de toplam uzunluk ve G simgelerinin uyumudur. Çözüm dizisinde beş adet G olduğunu biliyoruz. (1) numaralı dizinin ortasında bir adet G var. Kalan kısımda da dört tane G olmalı. Dikkat edersek (4), (6) ve (7) numaralı parçalarda yanyana G simgeleri var. Çift G simgeleri (4) numaralı parçanın sonunda, (6) ve (7) numaralı parçaların ise başında. (6) ve (7) numaralı parçalar aynı uzunlukta ve birbirlerini örtemiyorlar. Demek ki ya (4) ve (6) numaralı parçalar birbirini örterken (7) numaralı parçanın ilk G simgesi (5) numaralı parçanın son G simgesini örtecek, ya da (4) ve (7) numaralı parçalar birbirlerini örterken (6) numaralı parça (5) numaralı parçanın son G simgesiyle ilgilenecek. Her iki durumda da (4) numaralı parça (1), (2), (3) ve (5) numaralı parçalardan oluşan bloğun önüne gelmeli.
Dördüncü deneme: A C T T G G (4) G G T C A (6) T A A C T G T T (1) C T G T T C C A (2) A C T G T T C (3) C C A A C G (5) G G T A A (7) A C T T G G T C A T A A C T G T T C C A A C G G T A A
Kolayca görüldüğü gibi bu dizinin uzunluğu 27 simge, yani aradığımız dizi bu olamaz. O zaman aynı yöntemi (4) ve (7) gruplar başta olacak şekilde deneyelim.
Beşinci deneme: A C T T G G (4) G G T A A (7) T A A C T G T T (1) C T G T T C C A (2) A C T G T T C (3) C C A A C G (5) G G T C A (7) A C T T G G T A A T A A C T G T T C C A A C G G T C A
Maalesef bu dizi de 27 simge uzunluğunda ama bu denemeye biraz dikkatli bakarsak (7) numaralı parçanın sonuyla (1) numaralı parçanın başının örtüştüğünü görürüz. Şimdi bunu kullanarak bir deneme daha yapalım.
Altıncı deneme: Dördüncü deneme: A C T T G G (4) G G T A A (7) T A A C T G T T (1) C T G T T C C A (2) A C T G T T C (3) C C A A C G (5) G G T C A (6) A C T T G G T A A C T G T T C C A A C G G T C A A = 6 C = 6 G = 5 T = 7
İstenen simge dağılımına ve dizi uzunluğuna sahip bir çözüm bulduk. Şimdi bütün parçaların bu dizi üzerinde bulunduğunu göstermek kaldı. Bunu da size alıştırma olarak bırakıyorum. Bu arada bu dizilimin verilen şartları sağlayan tek çözüm olup olmadığını da ispatlamadım. Bu da ileri seviyedekiler için bir alıştırma olsun.