Yapay zekâ ile SEO ve AEO nasıl yapılır?

Teknik SEO Nedir? Tarama, İndeksleme ve Render Kontrol Listesi

Teknik SEO, bir siteyi taranabilir, indekslenebilir ve render edilebilir hale getirme işidir; böylece arama motorları ve yapay zeka cevap motorları sayfayı gerçekten okuyabilir. Bu, her sıralamanın üzerine oturduğu temeldir. Bu rehber çekirdek kontrolleri (tarama bütçesi, indeks kapsamı, render, robots, site haritaları, durum kodları) ve bir yapay zeka ajanının bunları manuel denetim yerine dakikalar içinde nasıl koştuğunu anlatır.

Teknik SEO nedir ve AI aramada neden önemlidir?

Teknik SEO, bir arama motorunun (ve artık bir yapay zeka cevap motorunun) bir sayfaya ulaşabilmesini, onu saklayabilmesini ve üzerindekini okuyabilmesini sağlama işidir. SEO’nun çoğu insanın aklına gelen kısımlarının altında durur. İçerik SEO’su ne söyleyeceğine, sayfa-içi SEO ise nasıl söyleyeceğine karar verir; ama teknik SEO ikisini de anlamlı kılan önceki soruyu yanıtlar: makine sayfaya gerçekten ulaşıp onu görebiliyor mu? Tarayıcının ulaşamadığı, motorun indekslemeyi reddettiği ya da kelimeleri ancak bir betik çalıştıktan sonra beliren parlak bir makale hiçbir şeyde sıralanmaz. Teknik SEO tesisattır; tesisat sızdırdığında diğer tüm emek de onunla birlikte boşa akar.

Bir sayfanın sıralanabilmesi için geçmesi gereken üç kapıyı düşünmek yardımcı olur. Birincisi tarama (crawl): bir botun URL’yi getirmesine izin verilmeli ve bot o sayfayı bir bağlantı veya site haritası üzerinden bulabilmeli. İkincisi indeks: getirildikten sonra motor, sayfayı veritabanında saklamaya ve sorgular için değerlendirmeye değer bulmalı. Üçüncüsü render: motor gerçek içeriği görmeli, ki bu, içerik ilk HTML geldikten sonra JavaScript ile boyandığında garanti değildir. Bu kapılardan birini kaçırın, sayfa ne kadar iyi olursa olsun görünmez olur. Teknik SEO’nun büyük kısmı, basitçe bu üç kapıdan hiçbirinin yanlışlıkla kapanmadığından emin olmaktır.

Bu, AI arama için her zamankinden daha önemli, daha az değil. Bir yapay zeka cevap motoru, hiç getirmediği, hiç indekslemediği ya da metni bir betiğin arkasına kilitlendiği için okuyamadığı bir sayfayı kaynak gösteremez. ChatGPT, Perplexity ve Google’ın AI Overviews gibi araçların arkasındaki büyük dil modelleri tarayıcılarla beslenir; bu tarayıcılar da klasik arama botuyla aynı robots kurallarına uyar, aynı bağlantıları izler ve aynı durum kodlarına çarpar. Hatta daha affedicisizdirler: birçoğu JavaScript’i hiç çalıştırmaz, dolayısıyla içeriğini istemci tarafında render eden bir sayfa bir insana kusursuz görünürken modele tamamen boş gelebilir. Teknik sağlık, bir AI cevabında alıntılanmanın giriş bedelidir; bunu atlayan bir site, herkesin görünmek için yarıştığı sistemlere karşı görünmezdir.

Bir ayrım sık karıştırılan bir kafa karışıklığını önler. Teknik SEO, sayfa hızı ile aynı şey değildir. İşin performans tarafı olan Core Web Vitals, yükleme, etkileşim ve görsel kararlılığı kendi rehberinde ele alınan konu, bir sayfa yüklendikten sonra ne kadar hızlı ve istikrarlı hissettirdiğini ölçer. Buradaki teknik SEO ise sayfaya hiç ulaşılıp okunabilip okunamadığı sorusudur. Bir sayfa şimşek gibi hızlı olabilir ama başıboş bir direktifle indeksten düşmüş olabilir; yavaş bir sayfa ise her şey yolundaysa pekâlâ sıralanabilir. İkisi birbirini güçlendirir ama farklı soruları yanıtlar; birini düzeltmek diğerine hiçbir şey katmaz.

Hangi teknik kontroller sıralamayı en çok etkiler?

Teknik SEO sorunlarının çoğu kısa bir yüksek-etkili sorun listesine dayanır; bunların bir kısmı neredeyse hiçbir maliyeti olmadan koca bir siteyi bir gecede dibe çekebilir. Önceliklendirmenin dürüst yolu etki yarıçapına göredir: önce sayfaları toptan indeksten düşürebilen kontrollerle başlayın, sonra zamanla performansı sessizce aşındıranlara inin.

Listenin başında kazara engelleme durur, çünkü yapılması en ucuz, görmezden gelinmesi en pahalı hatadır. robots.txt içindeki tek bir Disallow: /, tüm tarayıcılara siteden uzak durmalarını söyler; bir meta etiketinde ya da HTTP başlığında başıboş bir noindex direktifi ise motorlara zaten getirdikleri bir sayfayı düşürmelerini söyler. Bu ikisi sürekli karıştırılan iki ayrı araçtır: robots.txt taramayı denetler (bot URL’yi getirebilir mi), robots meta etiketi ise indekslemeyi denetler (getirilmiş bir sayfa saklanabilir mi). Tehlikeli kombinasyon, bir sayfayı robots.txt’te engellerken aynı zamanda noindex yapmaya çalışmaktır: bot sayfayı tarayamazsa noindex’i hiç görmez ve URL, çıplak bir bağlantı olarak indekste asılı kalabilir. Her denetimin kontrol ettiği ilk şey, önemli hiçbir şeyin engellenmemiş ve noindex’lenmemiş olmasıdır, çünkü sayfa kapıda dışarıda bırakıldıysa başka hiçbir optimizasyonun önemi kalmaz.

Kanonikleştirme (canonical) bir sonraki katmandır. Bir canonical etiketi, neredeyse-aynı sayfaların hangi sürümünün gerçek olduğunu motorlara söyler ve tüm kopyaların sıralama sinyallerini tek seçilmiş bir URL’de toplar. Siteler istemeden sürekli kopya üretir: aynı sayfaya sondaki eğik çizgiyle ve onsuz, www ile ve onsuz, HTTP ve HTTPS üzerinden ya da sonuna yapışmış izleme parametreleriyle ulaşılabilir. Canonical’lar eksik olduğunda veya yanlış URL’ye işaret ettiğinde motor tahmin etmek zorunda kalır ve sıklıkla kötü tahmin eder; otoriteyi kopyalar arasında böler ya da temiz olan yerine parametre yüklü sürümü indeksler. Canonical’ları doğru kurmak, kendinizle rekabet etmeyi durdurmanın yoludur.

Durum kodları ve yönlendirmeler üçüncü katmandır ve tarama bütçesinin sessizce kanadığı yer burasıdır. Her URL doğru HTTP durumunu döndürmeli: canlı sayfa için 200, kalıcı taşınma için 301, gerçekten yok olan bir şey için 404 veya 410. Tuzaklar inceliklidir. A’nın B’ye, B’nin C’ye işaret ettiği yönlendirme zincirleri taramayı boşa harcar ve doğrudan geçmesi gereken sinyali sulandırır. Yönlendirme döngüleri sayfayı tamamen bozar. Hepsinin en sinsisi ise soft 404’tür: gerçek içeriği olmayan ama yine de 200 durumu döndüren bir sayfa, böylece motor onu “yok” saymak yerine boşluğu taramaya ve indekslemeye devam eder. Çok dilli siteler için dördüncü bir kontrol vardır: hreflang, motorlara bir sayfanın İngilizce ve Türkçe sürümlerinin birbiriyle rekabet eden kopyalar değil, farklı kitleler için aynı içerik olduğunu söyler; kırık veya karşılıklı olmayan hreflang ise yanlış dili yanlış arayan kişiye gönderir. Hiçbiri göz alıcı değildir ama her biri bir sızıntıdır; bunları tıkayan bir site, kazandığı otoritenin her damlasını korur.

Tarama bütçesi ve indeks kapsamı gerçekte nasıl çalışır?

Tarama bütçesi (crawl budget), bir arama motorunun belirli bir zaman aralığında sitenizden getirmeye istekli olduğu URL sayısıdır ve iki kuvvet onu şekillendirir. Birincisi tarama hızı: motorun sunucunuzu aşırı yüklemeden ne kadar hızlı getirebileceği, yavaş veya hata üreten bir site bunu kendiliğinden düşürür. İkincisi tarama talebi: motorun sayfalarınızı gerçekte ne kadar istediği, popülerlik ve tazelikle yükselir, bayat veya düşük değerli URL’ler için düşer. Birkaç yüz sayfalık küçük bir site için tarama bütçesi nadiren darboğazdır ve onunla uğraşmak genelde boşa emektir. On binlerce ya da yüz binlerce URL’lik büyük bir site içinse belirleyici olur, çünkü bot bütçesini çöpe harcarsa önemli sayfalara hiç ulaşamaz.

Önceki bölümdeki soft 404’ler, yönlendirme zincirleri ve sonsuz parametre URL’lerinin bir derli-topluluk meselesinden gerçek bir maliyete dönüştüğü yer burasıdır. Her filtre kombinasyonu için benzersiz bir URL üreten faceted (filtreli) navigasyon, milyonlarca neredeyse-aynı sayfa doğurabilir; bu labirente salınan bir tarayıcı, kimsenin aramadığı kombinasyonlarda dolaşarak tüm bütçesini yakarken yeni ürün sayfalarınız keşfedilmemiş bekler. Çözüm, motorun kendini boşa harcamasını durdurmaktır: sonsuz alanları engelleyin, boş sayfalar için dürüst 404 döndürün, yönlendirme zincirlerini kısaltın ve site haritasını yalnızca gerçekten indekslenmesini istediğiniz kanonik URL’lere yönlendirin. Site haritasının işi dar ve sık yanlış anlaşılır: hangi URL’lerin var olduğunu ve en son ne zaman değiştiğini öneren bir keşif yardımcısıdır, bir sıralama kolu değil; onu düşük değerli veya kanonik olmayan URL’lerle doldurmak, motora ona daha az güvenmeyi öğretir.

İndeks kapsamı denklemin diğer yarısıdır ve taramanın gerçek varlığa dönüştüğü yerdir. Taranmış olmak, indekslenmiş olmayı garanti etmez. Bir motor sakladığından çok daha fazla URL getirir ve bir sayfa birkaç ara durumdan birine düşebilir: keşfedilmiş ama henüz taranmamış, taranmış ama ince/yinelenen bulunduğu için indekslenmemiş, ya da indekslenmiş ama nadiren gösterilen. Yayınladığınız URL’lerle bir motorun gerçekten sakladığı URL’ler arasındaki fark, teknik SEO’daki en aydınlatıcı tek sayıdır, çünkü size sitenizin ne kadarının hiçbir iş yapmadığını söyler. Search Console’un sayfa indeksleme raporu her durumu açıkça adlandırır; iş, o raporu okumak, her hariç tutulan sayfanın neden hariç tutulduğunu anlamak ve ya nedeni düzeltmek ya da o sayfanın indekslenmemesi gerektiğini kabul etmektir.

AI arama, birkaç yıl önce var olmayan bir katman ekler: kendi bütçeleri ve kendi izinleri olan yeni bir tarayıcı filosu. GPTBot, ClaudeBot, PerplexityBot, Google-Extended ve diğerleri cevap motorlarını beslemek için web’i getirir ve her biri robots.txt’inizde ayrı yönetilir. Bu, çoğu sitenin hiç bilinçli olarak vermediği bir karar yaratır. Bu tarayıcıları engellerseniz içeriğinizi eğitilmekten veya cevaplanmakta kullanılmaktan korursunuz, ama aynı zamanda giderek klasik sonuçların üzerinde oturan AI cevaplarından da kendinizi çıkarırsınız. İzin verirseniz alıntılanmaya uygun hale gelirsiniz, içeriğinizin o sistemleri beslemesi pahasına. Evrensel doğru bir cevap yoktur, ama yanlış bir varış yolu vardır: aşırı geniş bir kuralla onları kazara engellemek ve kitlenizin bakmaya başladığı yerden kaybolduğunuzu hiç fark etmemek.

Bir yapay zeka ajanı teknik SEO denetimini nasıl koşar?

Bir teknik denetim kapsamlı, kural-bağlı ve derinlemesine tekrarlıdır, ki bu, tam da bir yapay zeka ajanının bir insandan daha iyi yaptığı türden iştir ve forgehouse açısı budur. Büyük bir siteyi denetleyen bir insan URL’lere tıklar, durum kodlarını bir tabloya kopyalar, robots.txt’e gözünü kısarak bakar ve uzun kuyruğa varmadan çok önce sabrı tükenir. Bir ajan sıkılmaz. Sitedeki her URL’yi tarayabilir, her birinin HTTP durumunu kaydeder, robots direktiflerini ve canonical etiketini okur, site haritasında görünüp görünmediğini kontrol eder ve tüm tabloyu tek bir geçişte bellekte kurar.

İşlemlerin sırası üç kapıyı yansıtır. Önce ajan tarama yürüyüşünü yapar: ana sayfadan başlayıp iç bağlantıları ve site haritasını izleyerek hangi URL’lerin var olduğunu ve hangilerine ulaşılabildiğini haritalar, hiçbir bağlantının işaret etmediği yetim (orphan) sayfaları ve çok fazla tık derinde gömülü sayfaları ortaya çıkarır. Bu, iç linkleme ve konu-kümesi denetimini çalıştıran aynı bağlantı-grafiği yürüyüşüdür; iki kontrolün aynı geçişe ait olmasının nedeni budur. Sonra indeks kapısını kontrol eder, bulduğu URL’leri bir motorun gerçekten sakladıklarıyla karşılaştırır. Search Console API’si sayfa indeksleme raporunu ve URL-başına incelemeyi programatik olarak sunar, böylece ajan Google’ın hangi sayfaları keşfettiğini, taradığını ve indekslediğini doğrudan Search Console’dan çekebilir ve yayınlanmış ama eksik veya indekslenmiş ama olmaması gereken her URL’yi işaretler. Son olarak her sayfanın ham HTML’sini getirip render edilmiş DOM ile karşılaştırarak render kapısını kontrol eder ve yalnızca JavaScript çalıştıktan sonra beliren içeriği yakalar.

Geri dönen şey bir yeşil-kırmızı duvarı değil, sıralı ve yinelenenleri ayıklanmış bir düzeltme listesidir: şu sayfalar kazara noindex’lenmiş, şunlar soft 404 döndürüyor, şunların canonical etiketi yanlış URL’ye işaret ediyor, şunlar üç sıçramayla yönlendiriyor, şu koca bölüm JavaScript olmadan görünmez. Her bulgu kendi önem derecesini ve düzeltmesini taşır, böylece bir insan bakmadan önce iş önceliklendirilmiş olur. Günler sürecek sayfa-sayfa manuel denetim, dakikalarla ölçülen bir geçişe çöker; ve ajan her seferinde aynı kontrolleri koştuğu için bir gerileme, trafik düştükten aylar sonra değil, belirdiği an ortaya çıkar. Bu tarama-ve-düzelt denetimini tüm sitenizde her ay kendiniz koşmak istemiyorsanız, Vorkaz teknik kontrolleri sizin için koşup bulduklarını düzeltebilir.

Render ve JavaScript SEO sorunları nasıl çözülür?

Render kapısı, en pahalı ve en az belirgin teknik sorunların yaşadığı yerdir, çünkü bunlar sayfaya bakan insana görünmezdir. JavaScript SEO’su, bir motorun bir ziyaretçinin gördüğü içeriğin aynısını görmesini sağlama disiplinidir ve zor olmasının nedeni motorların iki dalga halinde render etmesidir. Bir tarayıcı önce ham HTML’yi getirir ve içindekini hemen indeksler. Sonra, yedek kaynağı varsa, sayfayı JavaScript’i çalıştırıp nihai sonucu gören bir render servisine kuyruğa alır, ama bu ikinci dalga gecikebilir ve asla garanti değildir. İçeriğiniz yalnızca betik çalıştıktan sonra var oluyorsa, sıralamanızı gecikebilen veya atlanabilen bir render geçişine yatırıyorsunuz demektir ki bu göründüğünden çok daha büyük bir kumardır.

Riskin arkasındaki mekanizma, bir kez adlandırınca basittir. İstemci tarafında render edilen (CSR) bir sayfa neredeyse boş bir HTML kabuğu gönderir ve içeriği tarayıcıda JavaScript ile kurar, böylece ilk dalga neredeyse hiçbir şey görmez. Sunucu tarafında render edilen (SSR) veya statik üretilen (SSG) bir sayfa ise tam içeriği ilk HTML’de gönderir, böylece ilk dalga her şeyi görür ve render kapısı hiç soru olmaz. Neredeyse her JavaScript SEO sorununun çözümünün aynı olmasının nedeni budur: önemli içeriği sunucunun gönderdiği HTML’ye SSR, statik üretim veya ön-render ile koyun, böylece motor kelimelerinizi görmek için bir betiği hiç beklemek zorunda kalmasın. Sorununuz olup olmadığını test etmenin yolu, render edilen sayfaya değil ham HTML’ye doğrudan bakmaktır, kaynağı görüntüleyerek veya URL’yi getirerek, ve başlıklarınızın ve gövde metninizin gerçekten orada olup olmadığını kontrol etmektir. Search Console’un URL inceleme aracı taranan HTML ile render edilen sürümü yan yana gösterir ve soruyu kesin olarak çözer.

Aynı ilke bir grup ilgili tuzağı da yakalar. Talep üzerine yüklenen bir etkileşimin arkasına gizlenmiş içerik, örneğin yalnızca tıklanınca metni getirilen bir sekme, hiç tıklamayan bir tarayıcıya görünmezdir; DOM’da zaten mevcut ama bir sekme veya akordeon arkasında görsel olarak gizlenmiş içerik ise sorun değildir, çünkü HTML’dedir. Arkasında sayfalı URL’ler olmadan kaydırdıkça daha fazla öğe yükleyen sonsuz kaydırma, kaydırmayan bir bottan ilk ekranın ötesindeki her şeyi gizler. Tembel-yüklenen (lazy-load) görseller ve bölümler, tarayıcıya onları açan bir yedek gerektirir. Ortak nokta basittir: botun gerçekleştirmediği bir tarayıcı davranışına bağlı olan her şey, bir tık, bir kaydırma, bir betik, risktir; güvenli varsayılan, önemli içeriği bunların hiçbirini gerektirmeden ilk HTML’de mevcut kılmaktır.

AI arama için bu bir eşitlik-bozan değil, sert bir duvardır. Google en azından ikinci bir render dalgası denerken, AI cevap motorlarını besleyen tarayıcıların çoğu JavaScript’i hiç çalıştırmaz, dolayısıyla istemci tarafında render edilen bir sayfa onlara yalnızca geç görünmez, tamamen boştur. Klasik indekslemeyi koruyan aynı SSR veya SSG düzeltmesi, içeriğinizi en başta AI cevap motorlarına okunabilir kılan şeydir; bu da iki hedefin rekabet etmek yerine aynı yönü gösterdiğinin bir nedeni daha. Bu render-tarama-indeks disiplini, tam AI SEO otomasyon iş akışının bir katmanıdır ve onu çalıştıran tarama-ve-kontrol bağlayıcısı, tam olarak SEO & AEO Pro Kit’in herhangi bir siteye yöneltebileceğiniz tekrarlanabilir bir denetim olarak paketlediği şeydir.

İlgili

← Yapay zekâ ile SEO ve AEO nasıl yapılır?