Arama Motorları

Yayınlanma: 25/7/2024 1 15-20 Dakika

Önsöz

Bu yazıda arama motorlarını karşılaştırıp öneriler vereceğim. Eğer "arama motoru taktikleri" tarzı bir şey arıyorsanız (ki Google Dorking denen şey inanılmaz işe yarardır) sizi buraya [Arc] alalım. (verdiğim linklere bu tarz arşiv linkleri koyacağım ki sayfada değişiklik olursa veya silinirse erişilebiliriği korunsun)

Başlamadan önce bazı önemli notlarım var;

  • Birçok arama motoru, Google veya Bing gibi birkaç index motoruna bağlı. Yani, arama sonuçlarını index motoru buluyor ve kendi index motoru olmayan bir *arama motorunu* kullandığında aslında index sahibi olan siteye erişmek için bir proxy kullanmış gibi olursun. Ancak bunun bazı faydaları olabilir. Örneğin bu yazıda da bahsedeceğim SearXNG ile birçok indexi birlikte kullanabilir, DuckDuckGO ile Bing'i daha güvenli ve basit şekilde kullanabilirsin. Ancak unutma ki bu proxy arama motorları seni indexe karşı anonimleştirse de ne aradığın her zaman index sahibi tarafından kaydedilecektir. Yani aramaya kimlik numaranı yazma..
  • Değerlendirmede, arama motorlarının gizliliğe saygısını da değerlendireceğim, çünkü birçok arama motoru -Google başta olmak üzere- kullanıcıların birçok detayını (IP adresi, konum, arama terimleri vb.) toplayıp sunucularında tutuyor ve bunlar anonimize edilmeden, kişiler hakkında bilgilerle eşleştirilerek tutuluyor. Bunun en büyük sebebi reklamları özelleştirmek olsa da (ve evet, reklamverenlerle de bilgiler paylaşılıyor) şirketlerin kişisel bilgilerinizi paraya çevirmesi hoş değil.
  • Değerlendirmede, kendimce sonuç kalitesini de değerlendireceğim. bazı arama motorları indexleri kalitesiz olduğu için, bazıları SEO uğraşlarına (Search Engine Optimization, yani sitelerin sırf arama motorunda öne çıkmak için yaptığı absürd değişiklikler) karşı savunmasız olduğu için kötü sonuçlar bulabiliyor. Bu yüzden Google'da yaptığınız her aramada Maginot Hattı gibi dizilmiş bi' dizi haber sitesini aşmanız gerekiyor. Tabii bu sorunu aşmak kolay, (Maginot Hattı da öyleydi!), ya daha kaliteli bir arama motoru kullanacaksınız ya da arama yapmayı enine boyuna öğreneceksiniz. Bu yazı, birinci seçeneğe odaklı olacak. İkisini birden yaparak hayatın anlamına kadar her şeyi bulabilirsiniz :p
  • Ve en önemlisi;

  • Arama motorlarının sonuçları ne kadar sansürlediğini göze alacağım. Günah keçimiz Google bu konuda da örnek oluşturuyor tabii! (bunlara Google'ın şeytani bir şirket olması değil, tekel olması ve birçoğumuz için vazgeçilemez olması sebep oluyor.). Örneğin Google, "saidit.net" isimli politik konular içeren bir siteyi veya 4chan ile ilgili içerikleri büyük oranda gizliyor/geriye atıyor. Sansürün ne kadar kötü olduğundan bahsetmeme gerek yok, değil mi?

Google

Google , yaklaşık 93% oranla en çok kullanılan arama motoru olsa da asla en iyisi değil. Aradığın şeyleri, bi' düzine reklam ve sansürün ardında bulman zor olacaktır. Index motoru gayet geniş kapsamlı olsa da aşırı derecede sansürlü ve SEO yapılmamış siteleri çok gerilere atıyor, bu yüzden pek bir şey içermeyen ve birbirinin kopyası olan içerikler, gerçek bilgi içeren sitelerden çok daha geride kalıyor. Ayrıca gizlilik açısından en kötü seçenek çünkü aşırı düzeyde kullanıcı verisi topluyor ve bu verileri herhangi otoriteye verebiliyor (Amerika'da bu yaşandı [Arc]). Yani her an suçlanabiliriz, bu sebepten de suçlu olmasak da kendimizi her zaman gizli tutmalıyız. Google bunun için kötü.

Ancak Google Dorking için kullanılabilir. Google Dorking'i iyi araştır, çok işine yarar. Örneğin TÜİK Boşanma aramasını yaptığında muhtemelen mevcut yılın boşanma istatistiklerini bulacaksın ve gerisi haber sitelerinden ibaret olacak. Ama aynı aramayı Boşanma site:tuik.gov.tr şeklinde yaparsan tuik.gov.tr sitesinde "boşanma" kelimesi içeren tüm sayfaları bulacaksın. Bunun çok fazla örneği var, konuyla ilgileniyorsan Google Search Operators ya da Google Dorking şeklinde arayabilirsin. Hangi arama motorunda mı arayacaksın? Okumaya devam et :p

Bing

Bing, 4% ile en çok kullanın ikinci arama motoru, gizlilik açısından Google'dan pek farkı olmayan ama gözlemlerime göre daha az sansürlü olan başka bir big-tech icadı. Kendi indexi olduğu için önemli (ki DuckDuckGo da bunu kullanıyor) ancak Bing'i direkt olarak kullanmayı hiç anlamlı bulmuyorum. Mobil uygulamasının Play Store profiline göre net konum bilgisi, kişisel bilgiler, arama geçmişi gibi verileri toplamakla kalmayıp üçüncü partilerle paylaşıyor (yani satıyor).

Yandex/Yahoo

Yandex, diğer adıyla "dizi ismi yazınca ilk sırada korsan site çıkaran mucizevi arama motoru" :p, 1,5% kullanımla en çok kullanılan üçüncü arama motoru. Kendileri Amerikan casus yazılımlarından bıkmış bize, Rus casus yazılımı olarak yardım eder (!). Diğer popüler arama motorları gibi çok fazla veri toplayıp satıyor. Ancak indexi kendisinin ve idare eder gözüküyor. Yine de gizlilik sorunlarından dolayı tercihim değil.

Yahooo (1,3%), Yandex'e benzeyen Amerikan bir arama motoru. Gizlilik konusunda diğerleri gibi kötü (özellikle hesabın varsa). Kendi indexini kullanıyor ve sanırım indexi iyi.

Yandex ve Yahoo'yu sitelerinden kullanmasan iyi olur ama SearXNG üzerinden indexlerini kullanmak işe yarayabilir.

DuckDuckGo

DuckDuckGo, 0,7% ile en çok kullanılan gizlilik odaklı arama motoru! Bing ve birçok diğer index kaynağını (Google hariç) kullanıyor (dolayısıyla daha az sansürlü), arama sonuçları gayet güzel. açık kaynaklı olan; kişisel bilgileri toplamadığını, reklamları kişisel değil aramaya bağlı verdiğini iddia eden bir arama motoru. Ayrıca "!bangs" isimli özelliğiyle farklı sitelerden arama yapmayı çok kolaylaştırıyor; örneğin !g [ARAMA] yazarak aramanızı direkt olarak Google'dan yapabiliyorsunuz. DuckDuckGo'nın sağladığı hoş bir gizlilik bilgi sitesi ve bazı açık kaynaklı AI araçlarını ücretsiz ve gizli şekilde kullanabileceğiniz bir sayfası var.

Bu özelliklere bakıldığında DuckDuckGo, ana arama motoru olarak kullanmaya çok uygun gibi gözüküyor, gerçekten de öyle.

Ancak, şunu unutma ki DuckDuckGo, kar amacı güden sıradan bir şirket. Dolayısıyla para kazanma amacıyla hareket eden bir şirket ne yapıyorsa onu yapacaktır.

Örneğin; DuckDuckGo, kendi gizlilik bildirgesini ihlal etti, IP adresi ve arama geçmişini kaydediyor (diğer popüler arama motorlarına göre hiçbir şey ama gizliliği yok etmeye yeterli), ve bazı kullanım bilgilerini topluyor.

Yani diğer birçok arama motorundan daha iyi olsa da gerçek gizliliği sağlamaktan uzak.

SearXNG

SearXNG, tamamen açık kaynaklı ve merkeziyetsiz bir arama motoru. Yani kaynak kodunu alıp kendi sunucunda bile çalıştırabilirsin. Bu sebepten gizlilik ve şeffaflık açısından muazzam.

SearXNG, bir "Meta arama motoru", dolayısıyla birçok indexten gelen sonuçları topluyor (İstediğini açıp kapatabiliyorsun). Sonuç kalitesi de oldukça iyi.

Ayrıca en özelleştirilebilir, en çok özelliğe sahip arama motoru da diyebilirim. Bazı özellikleri şu şekilde;

  • DuckDuckGo gibi !bangs (Ancak bangs komutları da SearXNG'de çalışır, yani çok daha güvenli)
  • DOI rewrite: Ücretli makale sayfalarını ücretsiz kopyalarına iletir
  • Arama dili/tarihi seçeneği
  • Index motoru tercihi: ayarlardan hangi indexin kaynak alınacağını seçebilirsin, en çok kaynakta birden önde olan sonuçlar ön sırada gösterilir
  • Arama sonuçlarında sayfaların arşiv linkleri de bulunuyor

SearXNG merkeziyetsiz olduğu için sadece bir siteden değil, doğrulanmış 81 farklı siteden çalılşır. Listeyi buradan görebilirsin. Hız ve ayarlar bakımından ufak farkları bulunabilir.

Sonuç olarak SearXNG mükemmel bir arama motoru. Ancak bazı ufak kusurları var; mesela ayarlarını düzenlemek uzun sürüyor, bazen indexlere attığı istekler reddediliyor vb.

Bunun için sonraki işe yarar arama motoruna geçiyoruz;

4get

4get, SearXNG gibi tamamen açık kaynaklı ve birçok indexi kullanıyor. Bazı büyük avantajları var;
  • Kullanımı basit. Arama terimini yazıyorsun ve ayarlar kısmına girmeden çok fazla seçeneği sonuç sayfasından bulabiliyorsun
  • Birçok index üzerinden anında arama yapabiliyorsun: DuckDuckGo, Google, Brave, Yandex, Qwant vb.
  • Aramada tarih aralığı ve ülke seçebiliyorsun
  • Bayağı hızlı
  • Sadece arama verisini tutuyor (şifreli şekilde), onu da kullanımdan hemen sonra siliyor [Kaynak [Arc]]

Sonuç olarak, SearXNG ve bu çok iyi seçenekler.

4get de birden fazla sitede çalışıyor. Listeye buradan erişebilirsin (ayrıca sinir bozucu captcha'dan da kurtulabilirsin)

Startpage

Startpage, Google indexini kullanan ve gizlilik vaat eden bir arama motoru. Siteleri proxy ile açmaya yarayan "Anonymous View" isimli bir özelliği var (ve işe yarıyor).

IP adreslerini kaydetmediğini ve kullanıcıları takip etmediğini iddia ediyor [Arc]

Çoğunlukla dürüst görünse de Startpage'i kullanmamak için 3 sebebim var;

  • Google indexi kullandığı için sonuçlar aşırı sansürlü
  • Arama kayıtlarını tutuyor, anonim olsa da istemediğim bir özellik
  • Çoooook yavaş

Yine görüyoruz ki SearXNG ve 4get dışındaki gizlilik vaatleri çoğunlukla saçmalık.

Mojeek

Mojeek, tarafsız ve sansürsüz arama sonuçları verdiğini iddia eden [Arc], oldukça gizli bir arama motoru.

Kendi indexini kullanıyor ve sansüre karşı olma açısından dürüst gözüküyor. Mojeek ile ana akımdan ayrı ilginç siteler bulmak mümkün. Gizlilik açısından da çoğunlukla dürüst. Direkt olarak gizlilik bildirgesinde [Arc] yazdığı gibi;

Mojeek doesn't implement any kind of specific user tracking, whether that be at the time of visit or subsequently via standard logs, which Mojeek does keep indefinitely. These logs contain the time of visit, page requested, possibly referral data, and located in a separate log browser information

Kullanıcıları izlemeye yönelik kayıtları yok, IP adresi kaydı da tutmuyor. Ancak şu bilgileri kaydediyor: Tarih, saat, arama terimi, yönlendirilen siteler vb.

Mojeek, topladığı verilerin hiçbir şekilde başkasıyla paylaşılmadığını ve istatistik oluşturmak için kullanıldığını söylüyor.

Hiç yoktan iyidir. Kullanmaya değer. Ama ismi biraz tuhaf.. Mojeek.. Moojek?

Stract

Stract, bu yazıyı yazarken keşfettiğim inanılmaz iyi bir arama motoru. Gizlilik ve özelleştirilebilirliği birleştirmiş, üstüne kendi açık kaynaklı indexini kullanıyor!

Gizlilik bildirgesine [Arc] göre sadece arama terimi, saat ve tıklanan url'yi kaydediyor; bunlar da indexi geliştirmek için.

Sonuçlar çok net değil, yani DuckDuckGo gibi direkt aradığınız şeyi bulmuyor. Ancak bir şeyler keşfetmek için çok güzel. Özelleştirme seçenekleri çok iyi, mesela optic özelliği sayesinde aramaları sadece akademik, blog, forum gibi site türlerine limitleyebilirsin veya kendi iyi-kötü site listeni oluşturabilirsin.

Sonuç olarak çok güzel bir arama motoru. Ücretli olan Kagi'ye de benziyor.

Ayrıca Stract'ın Explore isimli bir benzer site bulucusu var, bayağı iyi çalışıyor. Ayrıca aramada da bunu göz önüne aldığı için ayarlardan beğenilen siteler kısmına 1-2 site ekleyince bile sonuçlar oldukça iyileşebiliyor.

SearchMySite

SearchMySite, genel bir arama motorundan ziyade dürüst olan bazı küçük siteler arasından arama yapmaya yarayan oldukça hoş bir site. Girip "random" butonuna basınca bile inanılmaz ilginç yazılar bulunabiliyor.

Gizlilik açısından pek iyi değil. IP adresi dahil hiç kayıt tutmuyor ama performans verilerini topluyor. Ayrıca site DDOS koruması için Cloudflare kullanıyor, bu pek hoş değil.

Yine de 2-3 arama yapıp çıkmak için güzel. Tabii İngilizce şart.

Ayrıca Marginalia'ya da bak.

Marginalia

Marginalia, SearchMySite'ye benzer şekilde belirli küçük siteler arasında arama yapan başka bir arama motoru.

Marginalia ile kolayca okuyacak hoş şeyler bulabilirsin, tabii yine İngilizce gerekiyor.

Marginalia oldukça güvenli. IP vs. kaydı tutmuyor, sadece arama terimini 24 saat boyunca tutup sonra da siliyor. [Kaynak [Arc]]

Ayrıca aynı geliştiricinin bir benzer site bulucusu ve site kaşifi de var.

Wiby

Wiby, sadece retro siteleri bulmaya yarayan ilginç bir arama motoru. Wiby ile bulabileceğin en yeni site en az 15 yıllık sanırım. Çok basit olan gizlilik bildirgesinde de bahsedildiği gibi 48 saate kadar basit bilgileri tutup sonra siliyor. Denemeye değer.

Özet

DuckDuckGo, kolay kullanılıyor ve iyi sonuçlar veriyor. Varsayılan arama motoru olarak kullanılabilir.

İyi sonuçlar bulmak için derin aramalar yapmak istiyorsan 4get, SearXNG ve Stract çok iyi arama motorları

Uzun yazılarla bir şeyler öğrenmek istiyorsan Marginalia, SearchMySite ve Stract (Optic: Indieweb & Blogroll veya Academic) kullan.

Şöyle bir grafik oluşturulabilir;

Motor Casusluk Kendi İndexi? IP Kaydı Sonuç Kalitesi Sansür
Google Aşırı Evet Evet İyi Aşırı
Bing Aşırı Evet Evet İyi Aşırı
Yandex Çok Evet Evet Orta Orta
Yahoo Aşırı Evet Evet Orta Çok
★ DuckDuckGo Az Kısmen Evet İyi Biraz
★ SearXNG Yok Hayır Siteye Bağlı İyi Yok
★ 4get Yok Hayır Yok İyi Yok
Startpage Yok Hayır Hayır İyi Aşırı
Mojeek Yok Evet Hayır Orta Yok
★ Stract Yok Evet Hayır Orta-İyi Yok
SearchMySite Az Evet (özel) Kısmen (Özel) Yok
Marginalia Yok Evet (özel) Hayır (Özel) Yok
Wiby Yok Evet (özel) 48 saat (Özel) Yok

Kaynaklar / Öneriler

Bu yazı, büyük oranda bu sayfadan [Arc] esinlenmiştir.

Ayrıca sitelerin ne kadar casusluk yaptığını gösteren bu siteye bak.

Google'ın sansürleri hakkındaki bu metni oku.

Google Dorking ve Google Search Operators konularını iyi araştır. Ayrıca bunlar çoğu diğer arama motorunda da çalışacaktır.

Ana Sayfaya Dön