Hoe zien zoekmachines een PDF bestand?
Er zijn genoeg sites die er ooit voor gekozen hebben om bepaalde informatie als PDF op de site te plaatsen. Vooral product sheets, gebruiksaanwijzingen, affiches en folders worden op deze manier online geplaatst omdat deze makkelijk te lezen en te printen zijn in het PDF formaat. Maar wat nou als het grootste gedeelte van je site uit PDF bestanden bestaat? Is het genoeg om er naar te linken? Wat zien zoekmachines als inhoud? Worden de links erin gelezen? Is de inhoudsopgave geïndexeerd? Allemaal vragen waar ik een antwoord op ga geven.
Als we kijken naar de algemene cijfers die Google ons geeft over de diverse types geïndexeerde bestanden zijn dit de aantallen van hoog naar laag:
- HTML: 3.610.000.000
- HTM: 2.920.000.000
- PHP: 879.000.000
- ASP: 698.000.000
- ASPX: 424.000.000
- JSP: 211.000.000
- PDF: 179.000.000
- SWF: 40.000.000
- DOC: 37.000.000
- TXT: 26.100.000
- XLS: 15.300.000

Er zijn momenten dat je graag meerdere pagina's tegelijk wilt filteren of selecteren in een overzicht, conversiedoel of conversiepad. Dan moet je wel weten hoe de zogenaamde Reguliere Expressies in Google Analytics werken. Een simpele "head match" of "kop zoeken" waarmee gematched kan worden op het begin van een URL volstaat niet altijd.
Wat hebben deze vier begrippen met elkaar gemeen? Nou, in veel gevallen is het zo dat door de eerste term te gebruiken je de andere drie min of meer onmogelijk maakt cq uitschakelt. Zoals wellicht bekend is kan er met AJAX voor gezorgd worden dat delen van pagina's opnieuw geladen worden zonder de hele pagina te verversen. Schitterende techniek die bepaalde zaken aanzienlijk kan versnellen, maar er is een keerzijde:
En zowaar het is zover: er is een soort van samenwerking ontstaan tussen 4 grotere zoekmachines. 