Weblog om bl.a. SEO og SEM

Søgemaskineoptimering – SEO Blog med Rosenstand

Google begynder at crawle links i forms

Friday, 11. April 2008 - 22:17 af Thomas Rosenstand

En af de mange ting der gør det sjovt at arbejde med mit fag – søgemaskineoptimering – er, at gårsdagens sandhed ikke altid er morgendagens ditto. Gennem mange år – faktisk alle årene – har det været en sandhed uden forbehold, at søgemaskinernes robotter aldrig kunne følge links i “Forms” – altså i formularer, rullefelter etc. Faktisk er det en af de ting, som det efterhånden er lykkedes at overbevise flertallet af programmører om. Og så sker der pludselig noget i dag.

Nu melder Google ud, at de er begyndt at crawle links i forms på visse hjemmesider. På normalt “Googlesk” fortæller de, at der er tale om udvalgte sites med høj trust – og kommer så ikke nærmere ind på, hvad det skal fortolkes som. Kan du ikke lige huske, hvad det går ud på? Se her, hvad crawl, indeksering og ranking er.

Både på Googles officielle webmaster blog og hos Matt Cutts skrives der om de nye muligheder. Du kan selv læse om crawling af forms hos Google og hos Matt.

Hvad betyder det så?

Ikke en hel masse lige med det samme – for Google siger klart, at det kun er visse sites, der beæres med denne særlige opmærksomhed fra Googlebot. Og da du ikke ved, om du er i det selskab, kan du ikke forlade dig på, at links i dine forms bliver crawlet.

På lidt længere sigt kunne jeg godt se nogle yderst interessante Black Hat muligheder. Når disse bliver udnyttet, vil Google naturligvis justere efter det – og sandsynligvis undlade at crawle de sites, hvor det sker.

Men der er da åbnet for eksperimenter, ikke? Mon ikke vi vil se nogle sjove og kreative udnyttelser af Googlebots nyfundne evne udi crawl af forms? Jeg tror det!

Update 12. april: Det viser sig, at min yderst begrænsede forstand på internet og den slags har medført nogle misforståelser. Lad mig derfor præcisere: Google eksperimenterer med at udføre det med forms, rullefelter etc., som mennesker gør – altså udføre såkaldte queries. Resultaterne af disse følger de så og crawler indholdet.

For text boxes, our computers automatically choose words from the site that has the form; for select menus, check boxes, and radio buttons on the form, we choose from among the values of the HTML. Having chosen the values for each input, we generate and then try to crawl URLs that correspond to a possible query a user may have made.

Det var det, der fik sådan en amatør som mig til at kalde det, at Google følger links i forms. Jeg må nok hellere øve mig på at være mindre “dagligdags” i mit sprogbrug – eller overlade det tekniske til dem, der ved meget mere end jeg gør :-)

Rosenstand out!

Om forfatteren

Thomas Rosenstand har skrevet 447 artikler på denne blog.

Tak fordi du læste med så langt - jeg er glad for, du kiggede forbi her!


Seneste video fra mig:

Relaterede artikler:

  1. Hvordan ser Google din hjemmeside? En lille hurtig her fra...
  2. Mere trafik fra Google Købet af e-bogen SEO-LEX 10.0...

15 kommentarer

  1.  Hans skrev som kommentar:

    Mon ikke det ligepræcis er risikoen for udnyttelse af googlebots ny egenskab at man vælger kun at slippe den løs på ‘trusted domains’. Men helt sikkert en spændende udvikling, både for SEO og webdesign formål.

  2.  Bachmann skrev som kommentar:

    Du er hurtig ude i dag ;)

    Jeg tror også vi vil se en masse black hat, hvis Google begynder at indeksere FORMS og SELECT bokse, men nu må vi ser hvordan det udarter sig, og mon ikke de har taget højde for lidt af hvert?

    Jeg er ihvertfald i gang med at teste.

  3.  Thomas Rosenstand skrev som kommentar:

    Hurtigt ude? Næ – jeg nåede bare ikke til at skrive om det før nu.

  4.  Søren Sprogø skrev som kommentar:

    Eh, hvad pokker er et link i en form? Og hvordan adskiller det sig fra normale links? :-P

    Nyheden er at Google eksperimenterer med at følge FORMS, og at lave mere eller mindre random valg i alle form elementerne.

    Og de eksperimenterer kun med det på et lille udvalg af websites: “Only a small number of particularly useful sites receive this treatment”.

  5.  Thomas Rosenstand skrev som kommentar:

    Hej Søren
    Et link inde i et er et link i en form. Det adskiller sig udelukkende ved, at Google ikke tidligere har fulgt disse af den simple årsag, at de ikke før har udført query i forms. Og som følge deraf ikke har fulgt de resultater, en given query leverer.
    Du kan læse en uddybende forklaring via de links, jeg har nævnt – men jeg har på fornemmelsen, det mere handler om semantik end om manglende viden om, hvad et link i en form er? Du er jo ikke hvem som helst, og jeg vover pelsen og påstår, at du godt ved, hvad jeg mener med det, jeg skriver.

    Jeg er ikke programmør – jeg får bare ting til at virke. Ofte ved at bede programmører om at gøre det, jeg beder. Syntaksen at kalde det for et link i en form er uden tvivl ikke korrekt. Men forstås nok af dem der vil?

    Netop vendingen “We only do this for a small number of high-quality sites right now” er åben for megen fortolkning. Hvis man synes, det er sjovt. Jeg synes, det er en spændende nyhed, og får Google det til at spille, som de gerne vil, rulles det nok bredere ud.

    Beklager min manglende indsigt i de korrekte termer. Jeg mener det godt ;-)

  6.  Mr. .Net skrev som kommentar:

    Rosenstand: Du skal ikke tage det så tungt! Jeg er programmør, og jeg har arbejdet med faget siden begyndelsen af 1990. Det er rigtigt, at det er ukorrekt brug af terminologien, når du skriver om “links i forms”.

    Til gengæld er det en fuldstændigt korrekt beskrivelse af, hvad der sker. Og din måde at forklare på gør, at jeg er en fast læser af din weblog. Det er mange af mine kolleger også, og dine forklaringer “helt nede på jorden” bliver flittigt læst her i virksomheden i både web- og marketingafdelingerne. Så fortsæt du roligt med at beskrive dit fag i lægmandstermer, for det glæder flere, end du tror! Og det er jo slet ikke en teknologiblog, du driver her.

    Tillykke med dit kursus på Teknologisk Institut i sidste uge! Jeg har hørt godt om det, og jeg kan jo også læse under din rubrik “Foredrag og kurser” her på webloggen, at du fik en fantastisk score.

    Søren: Jeg har også dit feed i min reader, og det er en fornøjelse. Jeg generes ikke af, at du ikke er så stærk i dansk grammatik, for indholdet er godt nok. Prøv at nyde Rosenstands indlæg på samme vis og med samme overbærenhed for de ikke fagligt korrekte betegnelser, som jeg nyder dine indlæg trods din kommasætning.

  7.  Thomas Rosenstand skrev som kommentar:

    Hej Mr. .net og velkommen her!

    Jeg tager det nu heller ikke særlig tungt :-) Men fuldstændigt upåvirket af det meste af en dags havearbejde fordi min gartner har svigtet mig – det er jeg godt nok ikke. Kun en tåbe frygter ikke haven!

    Tak for roserne.

  8.  Søren Sprogø skrev som kommentar:

    Bare rolig, jeg nyder skam at læse indlæg her på bloggen :-P

    Det eneste jeg såmænd ville sige med min kommentar, var:

    - At der rent teknisk ikke er noget der hedder “links i forms”. Med mindre man rent faktisk taler om et link man har placeret inden i en formular, hvilket Google ikke har problemer med at indeksere. Så jeg så et potentiale for at noget af posten kunne misforståes af mindre-tekniske individer.

    - At kilderne der er linket til siger at det kører på eksperiment stadiet på udvalgte sites. Det er langt fra sikkert at det går live, så du skal ikke forvente at se at GoogleBot’en laver random søgninger på din hjemmeside lige med det samme. Larsbachmann.dk, hvor jeg originalt blev ledt hen på denne post, havde ikke lige lagt mærke til denne detalje, og var allerede gået igang med sin egen “test”. Derfor tænkte jeg det var vigtigt lige at få nævnt her.

    Efter at have genlæst min kommentar kan jeg KLART se jeg burde havde formuleret mig anderledes og mere konstruktivt. Det er taget til efterretning.

    …Og ja, jeg stinker til tegnsætning :-P

  9.  Thomas Rosenstand skrev som kommentar:

    Og jeg stinker til korrekt brug af termer i forhold programmering – så har vi hver vores speciale der. Og det er jo i grunden ikke så ringe endda. God søndag!

  10.  Bachmann skrev som kommentar:

    Hej Søren
    jeg havde skam godt lagt mærke til den detajle, men selvom jeg med 99,99% sikkerhed ikke er blandt Googles udvalgte, så kan det skam være meget rart at få testet. Der kan jo være andre søgemaskiner der læser URL’s i form tags.

    Og et er jo hvad Google siger, og noget andet er hvad de gør ;)

  11.  Thomas Schulz skrev som kommentar:

    I min software (fx A1 Website Analyzer) kan du også følge “links” i GET forms… Men hvis du har mange select/option elementer… Så kan der hurtigt blive en del kombinationer ;-)

  12.  Mikkel deMib Svendsen skrev som kommentar:

    Google har i mange år indekseret resultatet af GET forms – det eneste nye her er, at de nu forsøger at gætte sig til hvad en formular skal udfyldes med. De sites der i forvejen supplerer med link-navigation til de GET resultat-sider de gerne vil have indekseret får det allerede.

    Derudover er det vigtigt at understrege, at Google fortsat ikke indekserer POST forms – det kommer de heller ikke til, at helt åbenlyse tekniske årsager, sådan lige med det samme.

  13.  Thomas Rosenstand skrev som kommentar:

    Jeps – og de tekniske barrierer i at indeksere POST forms overkommes næppe lige med det første. Må vi da gå ud fra…

  14.  pk skrev som kommentar:

    Men hvad skal Google bruge det til ? hvad er det smarte…

  15.  Thomas Rosenstand skrev som kommentar:

    Det var et sjovt spørgsmål fra én, der arbejder med SEO :-) De skal bruge det til at crawle og indeksere indhold på nettet med. Der ligger jo masser af indhold “gemt” bag dårlig programmering etc. Og det vil Google gerne kende.

Læg en kommentar

Bemærk: Alle kommentarer skal godkendes og kan ikke ses af andre end dig selv, før de er godkendte. Naturligvis accepterer vi ikke anonyme kommentarer, men du kan bede os fjerne dit navn og erstatte det med et synonym. Vi skal bare vide, hvem du er. Glem fake mailadresser - din kommentar ryger direkte i spamfilteret, hvis du ikke er parat til at stå ved, hvad du skriver! Vi forbeholder os ret til at afvise kommentarer.