Arama Motorları Nasıl Çalışır?

Arama Motoru Nedir?

Bir arama motoru; temel olarak, bir bilgisayar sisteminde saklanan veriler içerisinden, belirtilen kelime ve sözcükleri içeren ya da bu kelime ve sözcüklerle ilişkili olan bilgilerin getirilmesini sağlayan bilgi alma sistemidir. Arama motorunun kullanıcıya getirdiği bilgilere, arama sonuçları denir. Arama sonuçları, genellikle alaka düzeyine bağlı olarak, kullanıcılara listeler halinde sunulurlar. Arama motorları, istenilen bilgiyi en kısa sürede bulmayı, en alakalı sonuçları getirmeyi hedefler ve bu doğrultuda geliştirilirler.

Arama Motorlarının Kullanım Alanları

Arama motoru denildiğinde akla ilk gelen genellikle web arama motorlarıdır ancak web sitesi aramak ve indekslemek dışında, farklı amaçlara yönelik arama motorları da bulunmaktadır. Kullanıcıların kendi bilgisayarları içerisinde yaptığı klasör ve dosya aramaları, metin içi arama; video, görsel ve ses arama; semantik arama; içerdiği etken maddeye göre ilaç bulmayı sağlayan, medikal alana özel arama motorları gibi çok çeşitli alanlar düşünülebilir.

Arama Motorlarının Tarihçesi

İlk arama motoru Archie, 1990 yılında, bir üniversite öğrencisi olan Alan Emtage tarafından geliştirildi ancak bu arama motorunun algoritması günümüzdeki arama motorlarından çok farklıydı. Çünkü bu sistem, dosya arama üzerine kurgulanmıştı. Bunu, şu an bilgisayarınızda dosya araması yapmaya benzetebilirsiniz.

Arama motorlarının günümüzde kullandığımız hale gelmesi epey süreç aldı. Günümüzde hala varlığını sürdüren ve popüler arama motorları arasında gösterilen Yahoo, 1995 yılında hizmete başladı. Yahoo, ilk zamanlarında arama motoru olarak hizmet vermiş, sonrasında ise e-posta vb. benzeri hizmetler de sunarak, şirket hacmini geliştirme yoluna girmiştir.

Yıl 1998’i gösterdiğinde, şu an dünyada en çok kullanılan ve hayatımızdaki etkisini her geçen gün arttıran Google kurulmuştur.

WEB Arama Motorlarının Çalışma Prensibi

WEB arama motorları; web crawler, dizin ve kullanıcı arabirimi olmak üzere üç ayrı bileşenden oluşur. Spider/web crawler denilen arama motoru robotları, internet ortamındaki tüm web sitelerini tarayarak, arama motoru dizinine (veri tabanına) indekslenmesi gereken içeriklerin URL’lerini toplar. Ardından topladığı bilgileri arama motorunun veri merkezindeki sunuculara taşır. Bir web sitesinin site haritası ve sayfalarındaki tüm linkleri bularak, internetteki diğer web sitelerinde yer alan içeriklerle ilişkilendirir ve birbirleri ile olan link ilişkilerini kayıt altına alır.

Arama motorları, bir dizi faktörü içeren karışık algoritmalar ile web site içeriklerini ve linklerin birbiriyle ilişkisine göre puanlama yapar. Yüksek puanlı web site ve içerikler, arama motoru sonuçlarında en üst sıralarda yer alır.

Arama motoru sıralama algoritması; link yapısı, web site yaşı, anahtar kelimeler, responsive tasarım (mobil uyumluluk) ve web site ziyaretçi istatistikleri gibi faktörleri kullanır. Arama motoru optimizasyonu çalışmaları ile sıralama faktörleri doğrultusunda performans iyileştirmeleri (SEO) yapılabilir.

Web üzerindeki tüm linkler crawl metoduyla indekslendikten sonra, arama motorunun ikinci bileşeni olan dizinler devreye girer. Arama motorları, içerik ve konumlarına (URL) dair bilgi edindiği web sayfalarını, arama sonuçlarında listeleyebilmek için dizine eklerler. Web sayfalarının online kayıtlarının tutulduğu dizinler, kullanıcının arama yaptığı anahtar kelimeler ile internetteki tüm web sitelerinde bulunan içerikleri ilişkilendirmek için tanımlama ve düzenleme işlevini üstlenirler.

Bir kitabın içindekiler bölümü mantığında çalışan dizin, crawler’ın topladığı içerikleri saklayan bir modüldür. Dizine eklenen web sayfaları, kalite kriterlerine göre sınıflandırılırlar.

Arama motorları, tüm interneti tarayıp linkleri hafızasına alarak kaydeder. Dizine indekslenen bağlantılar, üçüncü bileşen olan kullanıcı arabirimi ile arama motorunda sorgulama yapan kullanıcılara sunulur.

Birden fazla arama motorunda tarama yapan metasearch kategorisinde arama motorları da vardır. En prestijli dizinlerden biri olan Yahoo, hem Google sonuçlarını hem de kendi dizinindeki bilgileri kullanır.

Open Directory de Google’a hizmet veren dizinlerdendir. Google ise, arama sonuçlarındaki web sitelerini domain otorite değeri, sayfa değeri ve Pagerank, Panda algoritmaları gibi kendine özgü kriterleri baz alarak tamamen kendi algoritmasına göre listeler.

Sürünme (Crawling)

Arama motorları, örümcek (spider) adını verdikleri web site tarama botlarını geliştirir. Bu botlar, bir web sitesindeki tüm bölümleri, klasörleri, alt sayfaları, içerikleri yani neredeyse her şeyi dolaşarak ilgili web site hakkında bilgiler toplar. Örümcek botlar, bu işlemleri web sitede keşfettikleri URL’leri takip ederek yapar.

İndeksleme (Indexing)

Arama motorlarının örümcek botları, işlerini bitirdiğinde, sıra indeksleme işlemine gelir. İndeksleme, web sitelerinin arama motoru sonuçlarında görünür hale gelmelerini sağlayan bir sistemdir. İndekslenen web siteler, çevrimiçi veri tabanlarında saklanarak kalıcı hale getirilir. Zaman geçtikçe örümcek botlar yeni yeni veriler keşfeder ise bu verilerin de indeksleme işlemleri yapılarak veri tabanına eklenir.

Sıralama (Ranking)

Arama motorları, kullanıcılarına her zaman en doğru sonuçları verebilmek için sıralama algoritmaları kullanır. Bu algoritmalar sayesinde kullanıcının sorgusu ile ilgili en doğru sonuçlar üst sıralarda yer alır. Günümüzdeki arama motorları, kullanıcı eğilimlerini takip ederek kişi bazlı sıralamalar yaparak daha doğru sonuçlar verir.

Google Arama Motoruna Özgü Algoritmalar

PageRank Algoritması

Page Rank, Google’ın arama algoritmasının orijinal çekirdeğini oluşturan kısmıdır. Google’ı Lycos ve AltaVista gibi erken rakiplerinden ayıran bu büyük faktördür. 90’lı yıllarda Larry Page ve Sergey Brin tarafından geliştirilen bu algoritma, bir sayfanın veya alanın işaret ettiği bağlantıları sayıp değerlendirerek, önemini belirliyor ve ardından 0 ile 10 arasında göreli bir puan vererek çalışmaktaydı.

Page Rank; linklerin, bir sayfanın, alan adının veya içeriğin başka kullanıcılarca onaylanması ve işlevsel olması fikrine dayanıyor, bu nedenle bir sayfadan ne kadar çok bahsedilmiş ve referans olunmuş ise sayfanın değeri o kadar artıyordu.
Günümüzde PageRank algoritması güncellenmese de, PageRank’in çalışma prensipleri halen geçerlidir

Panda Algoritması

Eskiden web sitelerinde daha az içerik yoğunluğu olan çok sayıda içerik yayınlanırdı. Bu içerikler ya birebir ingilizce çeviri ya da benzer bir yazının kelimeleri eşdeğerleri ile değiştirilerek yayınlanırdı. Hatta, genellikle bu makalelerin anchor textleri bile birebir eşleşirdi.

Arama sonuçlarının en üstünde görünmeye çalışmak için içeriklerden açıkça intihal yapıyorlardı. Bu tür web sitelerine içerik çiftlikleri denirdi ve çok üst sıralarda sıralanırlardı. Google, 2011 Şubat ayında, bu durumun önüne geçmek ve düşük kaliteli içeriğe sahip siteleri ayırmak için arama sonuçlarına uygulanan bir filtre olan Panda güncellemelerini duyurmuştur.

Multi-Core Processors (Çok Çekirdekli İşlemciler)

Multicore Organizasyonu

Multicore, tek bir fiziksel işlemci içerisinde, birden fazla işlemci çekirdeğinin yer alması mantığıyla tasarlanan işlemci mimarisini ifade etmektedir. Bu mimarinin amacı, aynı anda daha fazla görevi tamamlayabilmek ve bu sayede daha iyi sistem performansı elde etmektir.

Şekil 1 – Tek çekirdekli ve çok çekirdekli işlemci mimarisine ait diyagramlar ve sanal görünümü

Çalışma Prensibi

Multicore (çok çekirdek) teknolojisi, esas olarak paralel hesaplamaya odaklanmıştır. Paralel hesaplama ya da koşut hesaplama; aynı görevin, sonuçlarının daha hızlı elde edilebilmesi için çoklu işlemcilerde eş zamanlı olarak işletilmesidir.


Bu fikir, problemlerin çözümlerinin ufak görev parçalarına bölünmesi ve bunların eş zamanlı olarak koordine edilmesine dayanır. Çok çekirdekli işlemci mimarisi, görevlerin doğru bir şekilde ve eş zamanlı iş parçacıklarına bölünmesi ve müsait durumda olan çekirdekleri atanması için gerekli olan iletişimi sağlar. Görev tamamlandığında, her bir çekirdekte işlenen veriler, ana karta geri gönderilir.

Şekil 2 – Paralel hesaplama, seri hesaplamaya göre işlemi daha kısa sürede gerçekleştirmektedir.

Avantajları

Bilim ve teknolojideki gelişmeler, paralel hesaplamaya duyulan gereksinimi artırmaktadır. Tam da bu noktada çok çekirdekli işlemciler, sahip oldukları paralel hesaplama yetenekleri ile işlem performansını arttırır ve büyük sorunları daha kısa sürede çözmeye yardımcı olurlar.

Ayrıca, işlemci performansının artması ve işlemlerin daha kısa sürede çözümü, ısı ve güç tüketimini de azaltır. Bu sayede, daha az enerji tüketimi ile daha iyi performans elde edilmesi sağlanmaktadır. Multicore (çok çekirdek) teknolojisi; kod derleme, 3D oyunlar, video düzenleme, dosya sıkıştırma, yük altında çalışan sunucular gibi zorlu görevlerde çok etkilidir.

Piyasadaki Ürünler

İşlemci teknolojisinde AMD ve Intel kozlarını paylaşıyor. Günümüzde pazar payı kullanım oranlarında Intel’in AMD’ye karşı üstünlüğü bulunuyor. Ancak son yıllarda AMD’nin oyuncular tarafından daha çok tercih edilmesiyle birlikte, AMD
pazar payını yükseltmeye başlamış durumda. Listeye yer alan modellerin sunucu ve masaüstü bilgisayarlar için üretildiğini belirtelim. Sunucular için üretilen modellerin son kullanıcı odaklı ürünlere göre daha yüksek performans sağladığı biliniyor. Bu nedenle en yüksek performanslı modeller arasında sunucu modelleri bolca bulunuyor. PassMark Software tarafından yapılan performans testleri baz alınarak belirlenen, piyasadaki en iyi işlemci modelleri:

Intel Xeon W-3275M

Sunucu cihazlarda kullanılması için üretilen bu işlemci FCLGA3647 soket tipine sahip. 28 çekirdek ve 56 iş parçacığı bulunan model, 2.5 GHz temel çalışma hızına ve 4.4 GHz turbo hızla çalışıyor. Model Intel Turbo Boost Max teknolojisiyle 4.60 GHz hıza çıkabiliyor. İşlemcinin 205 W TDP değeri bulunuyor. Model 14 nm fabrikasyon sürecine sahip. Model, PCIe 3.0 desteğiyle kullanıcılarla buluşuyor. DDR4, 2933 MHz tip RAM desteği bulunan model, 2 TB’a kadar RAM desteği sunabiliyor. 2019’un son çeyreğinde piyasaya çıkan işlemci yapılan performans testinde 38.961 puan alarak 10. oldu. İşlemci, 7 – 8 bin dolar aralığında fiyat etiketine sahip.

AMD Ryzen 9 3950X

Son kullanıcı odaklı olarak masaüstü bilgisayarlar için geliştirilen model, AM4 soket tipine sahip. 16 çekirdek ve 32 iş parçacığına bulunan model, 3.5 GHz temel çalışma hızına ve 4.7 GHz turbo hızına sahip. İşlemcinin 105 W TDP değeri
bulunuyor. DDR4 ve 3200 MHz tip RAM desteği bulunan model, 128 GB’a kadar RAM desteği bulunabiliyor. İşlemci 7 nm fabrikasyon sürecine sahip. Bu model yapılan performans testinde 39.300 puan almayı başardı. PCIe 4.0 destekleyen işlemcinin fiyatı, 6 – 7 bin TL arasında bir değere sahip.

AMD EPYC 7502P

Sunucu bilgisayarlar için üretilen model, SP3 soket tipine sahip. 32 çekirdek ve 64 iş parçacığına sahip olan işlemci, 2.5 GHz temel çalışma hızına ve 3.4 GHz turbo çalışma hızına sahip. Model, 180W TDP değeriyle çalışıyor. PCIe 4.0 desteği bulunan modelin DDR4 ve 3200 MHz RAM desteği de bulunuyor. Performans testinden 47.949 puan alarak 8. olan modelin, en yüksek RAM desteği ise 4 TB. Model, multi-chip module (ikili çip modülü) ile ilk çipte 7 nm ve ikinci çipte 14 nm fabrikasyon sürecine sahip. Fiyatı ise 2 – 3 bin dolar arasında bulunuyor.

AMD EPYC 7452

Bir diğer sunucu odaklı model olan EPYC 7452 de SP3 soket tipiyle çalışıyor. 32 çekirdek ve 64 iş parçacığı bulunan model, 2.4 GHz temel çalışma hızına ve 3.4 GHz turbo çalışma hızına sahip. Model, 155 W TDP değeriyle dikkat çekiyor.
PCIe 4.0 teknolojisini destekleyen model, DDR4 ve 3200 MHz RAM’leri destekleyebiliyor. İkili çip modülü bulunan model 7 nm ve 14 nm fabrikasyon sürecine sahip olan mimariye sahip. Performans testinde 53.075 puan alarak 7. olan
model, 4 TB’a kadar RAM desteği sunabiliyor.

AMD Ryzen Threadripper 3960X

sTRX4 soket tipine sahip olan model, 24 çekirdek ve 48 iş parçacığına sahip. Ayrıca model, 3.8 GHz temel çalışma hızına ve 4.5 GHz turbo çalışma hızıyla işlemleri yerine getiriyor. Bu model 280 W TDP değerine sahip. Bu da modelin diğer
modellere göre daha fazla elektrik tüketimi olduğunu gösteriyor. DDR4 ve 3200 MHz RAM desteği bulunan model, PCIe 4.0 desteği ve maksimum 512 GB RAM desteği sunabiliyor. 7 nm fabrikasyon süreciyle üretilen model, performans testinden 55.777 puan aldı ve 6. sıraya yerleşti. Bu model son kullanıcı, masaüstü cihazlar için üretildi. Modelin fiyatı 12 – 13 bin TL arasında.

AMD Ryzen Threadripper 3970X

Bir diğer masaüstü modeli olan 3970X, bir önceki modele göre daha gelişmiş özelliklere sahip. sTRX4 soket tipi desteği bulunan bu modelde, 32 çekirdek ve 64 iş parçacığı bulunuyor. İşlemcinin 3.7 GHz temel çalışma hızı bulunurken, 4.5 GHz turbo çalışma hızı bulunuyor. Model, 280 W TDP değerine sahip. DDR 4 ve 3200 MHz RAM desteği bulunan model, en fazla 512 GB RAM’i destekliyor. PCIe 4.0 desteği ile çalışan model, 7 nm fabrikasyon sürecine sahip. Model yapılan performans testinde 63.231 puan almayı başardı. İşlemcinin şu anki fiyatı 18 – 19 bin TL arasında bir değere sahip.

AMD EPYC 7702P

Bilgisayar işlemcileri arasında bir diğer sunucu odaklı model olan 7702P, SP3 soket tipine sahip. 2.0 GHz temel çalışma hızına ve 3.4 GHz turbo hızıyla çalışan model, 64 çekirdek ve 128 iş parçacığına sahip. Modelin 200 W TDP değeri bulunuyor. PCIe 4.0 desteği bulunan modelin RAM desteği de DDR4 ve 3200 MHz şekilde. Model, en fazla 4 TB RAM destekleyebiliyor. İkili çip modülü bulunan modelde ilk çip 7 nm ve ikinci çip 14 nm fabrikasyon sürecine sahip. Model performans testinde 63.910 puan aldı ve 4. sıraya yerleşti. Modelin satış fiyatı 4 – 5 bin dolar arasında seyrediyor.

AMD EPYC 7742

Bu model de SP3 soket tipiyle bilgisayarlarda görev alıyor. Modelin 64 çekirdeği ve 128 iş parçacığı bulunuyor.
Model, 2.3 GHz temel çalışma hızına ve 3.4 GHz turbo hıza sahip. PCIe 4.0 desteği bulunan model, DDR4 ve 3200 MHz RAM destekleyebiliyor. İşlemcinin en destek verdiği en yüksek RAM miktarı ise 4 TB. İkili çip modülü bulunan işlemcide ilk çekirdek 7 nm ve ikinci çekirdek 14 nm fabrikasyon sürecine sahip. Özelliklerini belirttiğimiz model performans testinde 66.679 puan aldı ve 3. sıraya yerleşti. Modelin fiyatı 7 – 8 bin dolar arası bir değere sahip.

AMD EPYC 7702

Sunucu odaklı olan EPYC 7702, 64 çekirdek ve 128 iş parçacığına sahip. SP3 soket tipiyle çalışan model, 2.0 GHz temel çalışma hızına ve 3.4 GHz turbo çalışma hızına sahip. PCIe 4.0 desteği bulunan model, 200 W TDP değerine sahip. DDR4 ve 3200 MHz RAM desteği bulunan işlemci en fazla 4 TB RAM’i destekleyebiliyor. İkili çip modülü bulunan modelde ilk çekirdek 7 nm ve ikinci çekirdek 14 nm fabrikasyon sürecine sahip. Model, performans testinde 71.362 puan aldı ve 2. olmayı başardı. Modelin satış fiyatı 6 – 7 bin dolar arasında değere sahip.

AMD Ryzen Threadripper 3990X

Zirvede AMD Ryzen Threadripper 3990X bulunuyor. Masaüstü için geliştirilen ve birçok sunucu odaklı modeli geride bırakıp 1. olmayı başaran model, sTRX4 soket tipine sahip. Modelde 64 çekirdek ve 128 iş parçacığı bulunuyor. İşlemci, 2.9 GHz temel çalışma hızına ve 4.3 GHz turbo hıza sahip. PCIe 4.0 desteği bulunan işlemci, 280 W TDP değerine sahip. DDR4 ve 3200 MHz RAM desteği sunan model, en fazla 512 GB RAM’i destekleyebiliyor. İşlemci, 7 nm fabrikasyon sürecine sahip. Model birinci olduğu performans testinde 80.664 puan almayı başardı. Modelin bu başarısı takdire şayan. Çünkü masaüstü modellerin sunucu modellerini geçmesi epey zor. Çünkü sunucu modelleri daha yüksek
kapasiteli işlem yapmaları için geliştiriliyor. Ancak performans testinde 3990X birinci gelmeyi başardı.