www.r10.net küresel ısınmaya hayır seo yarışması

Yarışma Banner
Add to Google · Digg · Post to del.icio.us · Add To Furl · Netscape · Add To My Yahooweb · Add To Reddit · Add To Netvouz
 
Küresel ısınma Nedir?Küresel ısınma Nedir?
Küresel ısınmanın EtkileriKüresel ısınmanın Etkileri
Kyoto ProtokolüKyoto Protokolü
BM RaporuBM Raporu
Nükleer FelaketNükleer Felaket
Küresel ısınma İçin Neler Yapabiliriz?Neler Yapabiliriz?
Sera GazlarıSera Gazları
Küresel ısınmanın KanıtlarıKüresel ısınmanın Kanıtları
Nesli Tükenen CanlılarNesli Tükenen Canlılar
Çevre Kirliliği Nedir?Çevre Kirliliği Nedir?
Küresel ısınma AlarmıKüresel ısınma Alarmı
Küresel ısınmaya RaporuKüresel ısınma Raporu
Fosil Yakıtlar Ve EnerjiFosil Yakıtlar Ve Enerji
Küresel ısınma Neyin HabercisiNeyin Habercisi
Dünyanın Su Dengesi BozukSu Dengesi Bozuk
Kritik Eşiğe 2C° KaldıKritik Eşiğe 2C° Kaldı
Alternatif Enerji KaynaklarıAlternatif Enerji Kaynakları
Mamutların Yok Oluş NedeniMamutlar
www.r10.net küresel ısınmaya hayır seo yarışmasıKüresel ısınma Yüzünden
 
Seo Nedir?Seo Nedir?
Küresel Isınma Nedir?Metataglar Ve Anlamları
Negatif SeoNegatif Seo
Arama Motoru AjanlarıArama Motoru Ajanları
Cloaking Nedir?Cloaking Nedir?
Webmaster SorularıWebmaster Soruları
Teknoloji SorularıTeknoloji Soruları
rel="nofollow" Nedir?rel="nofollow" Nedir?
robots.txt Nedir?robots.txt Nedir?
Verimli Seo TeknikleriVerimli Seo Teknikleri
 

Arama Motoru Ajanları (Search Engine Spiders)

   Özet:
Internet günden güne büyüyor, milyonlarca dosya ve resim barındırıyor. Bununla birlikte insanlar bilgilere ulaşabilmek için çevrimiçi servislere bel bağlıyorlar. Tabi ki bu bilgilere en sağlıklı ulaşabilecekleri servisleri tercih ediyorlar. Bu nedenle “Arama Motorları” büyük önem kazanıyor. Arama motorları dediğimizde ilk akla gelen internet tarayıcımızda gördüğümüz sayfa olsa da, aslında işin arka tarafında birçok servis çalışmakta. Bu servisler kullanıcıların ulaşacağı verilerin sağlıklı, taze ve mantıklı olmasını sağlıyor. Arama Motoru Ajanları (Search Engine Agents) da bu servislerin bel kemiğini oluşturuyor. Temel olarak aranacak olan bilgileri tarayıp, düzgün ve belirli bir mantık çerçevesinde kaydediyorlar. Bu yazıda Arama Motoru Ajanlarının çıkış nedenleri ve mimarisi hakkında bilgiler bulunmaktadır.

   Giriş
Bizim arama motorlarında arama yapmamızdan önce o dosya ve belgelerin bir şekilde bulunup kaydedilmesi gerekiyor. Bunlar için Ajanlar veya örümcekler isminde özel yazılımlar geliştiriliyor. Bu yazılımlar internet adreslerini ve içeriklerini kaydediyorlar. Bu kayıtların yapıldığı sayfalardaki linkleri takip ederek sayfadan sayfaya geçiyorlar. Böylelikle milyonlarca siteye ulaşabiliyorlar. Bu programlar otomatik olarak her bulduğu linkleri gezmektedirler. (Çapraz link değişimleri bu sebeple yapılmaktadır.)

   Bu ajanların bulduğu web adreslerinin içeriğini kaydeden başka ajanlarda mevcut. Bu ajanlarda kaydettikleri verileri belirli mantıkta sıkıştırıp saklamaktadır.

   Bu ajanların dışında siteler için öncelik sırası belirlemek amacıyla çeşitli ajanlar çalışmaktadır. Bunlar o siteye ne kadar link verildiği, bu linklerin karşılığının olup olmadığını karşılaştırarak o site için bir önem puanı vermektedir. Bu sayede önemli görülen siteler aramalarda üst sıralarda yer alabilmektedir.

   Ajanlar Nasıl Çalışır?

Ajanlar arama motorlarının birer parçası olarak arka planda çalışmaktadır. Performans ve güvenilirlik en önemli noktalar. Ajanların çalışma performansı internet bağlantısının hızına ve bağlandığı sitenin hızına göre değişmektedir. Temel olarak ajanlar aşağıdaki adımları takip etmektedir:

   Sayfayı tamamen kaydet.
Kaydedilen sayfayı parçalara ayırarak içerisindeki tüm linkleri al.
Alınan tüm linkler için işlemi tekrar et.
Ajan herhangi bir internet veya Intranet adresinden başlayarak sayfaları kaydeder. Her kaydettiği sayfada yeni adresler ile karşılaştığı için sürekli olarak kayıt işlemine devam edecektir.

   Problemler

   İnternetin büyüme hızı ve web sayfalarının sayının artması altında örümceklerimiz ezildi.Büyük çapta hizmet gösteren ajanlar yüksek sayıda web adresi (URL) olması sebebiyle çeşitli problemlerle karşılaşmaya başladılar. Hazır olan tüm sitelerini gezip, taramak ve bunları hafızaya almak çok zor olmaya başladı. Diğer bir yandan bu toplanan verileri diskte yazmakta performans açısından çok da verimli olmamaya başladı. Milyarlarca web sitesini kaydedebilmek için terabytelarca iyi yönetilen disk alanı gerekiyor.

   Evre Takası

   Sağladıkları avantajlar ile birlikte ajanlarımızın yol açtığı sorunlarda meydana gelmeye başladı. Aynı anda birçok sayfası kaydedilen bir sunucuda fazladan bir yük binmeye ve yavaşlamalara yol açmaya başladı. Bu nedenle daha kibar ajanların hazırlanması gerekti, aynı anda sunucudan fazla veri çekmemeleri için.

   Ajanların aynı sunucu üzerinden aynı anda veri çekmesini düzenlemek amacıyla “Evre Takası (Phase Swapping)” metodunu kullanıyoruz.Takas etmek problemin tek çözümü olmasa da başarılı çözümlerden bir tanesi.

   Aşağıdaki şekildeki gibi aynı sunuculardaki verileri parçalara ayırıyoruz. Daha sonra aynı satırda olan adreslerden sadece bir tanesine gidip, diğer satıra gidiyoruz. Zamanımız arttığı için sütun sayımızı da artıyoruz. Bunun neticesinde aşağıda ki şekilde görülen çapraz şekilde giden bir yapı oluşuyor. Bu yapıyla birlikte aynı anda aynı sunucu üzerinden veri çekmemiş oluyoruz.

   Site Adresi Sıkıştırma (URL Compression)

   Ajanlarımız tüm adresleri kaydetmek durumundalar. Bunun için bu adresleri saklarken bir sıkıştırma algoritması kullanmamız gerekiyor, bu algoritma hem hızlı saklanabilmeli, aranabilmeli aynı zaman hızlı geri dönüşüm sağlayabilmeli.

   Kullanacağımız algoritma sunucuların birbirleriyle bağlanma ilkelerine benziyor. Algoritmamız da site adresleri kök (root) ve kuyruk (tail) olmak üzere ikiye ayrılıyor. Bir kök dizinin altında ağaç yapısı şeklinde kuyruklar sıralanıyorlar, bu kuyruklar sıralanırken çeşitli köklere bağlanabiliyorlar. Aynı site için birden fazla adres olabileceği içinde yansılar ayrıca belirtiliyor, böylece farklı adreste yayın yapan iki farklı site 2 kez kaydedilmemişte oluyor.


   Anahtar Kelimeler

   Örümcek (Spider), İndeksleyici (Indexer), Depolama (Repository), Doküman İndeksleyici (Document indexer), Robot, www.r10.net, seo, yarışması, küresel, ısınmaya, hayır

   Kaynaklar

* High Performance Large Scale Web Spider Architecture, Kasom Koht-arsa ve Surasak Sanguanpong
* A Bandwidth Friendly Search Engine, Clare Bradford ve Ian.W.Marshall
* Exploiting a Search Engine to Develop More Flexible Web Agents, Shou-de Lin ve Craig A. Knoblock
* How search engine work and a web crawler application, Monica Peshave

   Bu makale alıntıdır.Hasan Yaşar’a çok teşekkür ederiz.Orijinal makaleyi aşağıdaki linkten edinebilirsiniz:
   Arama Motoru Ajanları (Search Engine Spiders)
   hasanyasar.com/2006/06/arama-motoru-ajanlari-search-engine.html

   Bu metin ile teknik fakat seo konusunda işinize yarayacak çok önemli bilgiler öğrendik. Motor konusunda bilginiz ne kadar çok olursa yolda kalmaktan korkmazsınız :).

Saat16 2008 Cuma
8:22 AM
Sayfa 0.422 saniye oluşturuldu.
Sayfayı Yazdır
 
 
Seo YarışmasıSeo Yarışması
Önemsiz Bir GünÖnemsiz Bir Gün
ConstantineConstantine
www.r10.net Global Warmwww.r10.net Global Warm
Sıradan Bir GünSıradan Bir Gün
Askerlerimizi Kim KurtaracakAskerleri Kim Kurtaracak?
Bilimsel Hesap MakinesiBilimsel Hesap Makinesi
4 Gün Tatil4 Gün Tatil
Pageranklar GüncellendiPageranklar Güncellendi
Pageranklar DeğerlerimizPageranklar Değerlerimiz
www.r10.net Menemenwww.r10.net Menemen
Seo YarışmasıKazanan Uğur
Geçmek Bilmeyen GünlerGeçmek Bilmeyen Günler
Seo Yarışması Ve UPSSeo Yarışması Ve UPS
Yeşil Yahoo Ve www.r10.netYeşil Yahoo - www.r10.net
IPB Seo CommunityIPB Seo Community
Seo Yarışması Ve AlexaAlexa Rankı Yükseltmek
Üniversiteye Kayıt OldumÜniversiteye Kayıt Oldum
Seo Yarışması Mola VaktiSeo Yarışması Mola Vakti
Algoritma DeğişikliğiAlgoritma Değişikliği
Tercih Sonuçları AçıklandıTercih Sonuçları Açıklandı
Seo Yarışması DeğerlendirmeYarışma Değerlendirmesi
Seo Yarışması Ziyaretçi VerileriSeo Yarışması Verileri
Frindly Url ile Community SeoFrindly Url - Communityseo
www.r10.net Sıradan Günwww.r10.net Sıradan Gün
Googledan Yeni MetatagGoogle'dan Yeni Metatag
İndexler Hızla Artıyorİndexler Hızla Artıyor
DrcetinerdotorgDrcetinerdotorg
Imperia OnlineImperia Online
Seo Yarışması DevamıSeo Yarışması Devamı
Tüm Hakları Saklıdır. © UgguR
iyinet webmaster forumu 2008 seo yarışması
Yasal Yükümlülükler | Site Haritası | Sık Kullanılanlara Ekleyin | Ana Sayfam Yap | URL List | RSS | Küresel Isınma |
www.r10.net küresel ısınmaya hayır seo yarışması sitemize hoşgeldiniz. Seo Yarışması Hedefimiz: www.r10.net küresel ısınmaya hayır seo yarışması
Yukarı Çık