Bing non rispetta i robots.txt dei nostri siti
Per chiunque di voi si recasse nel forum per Webmaster di Bing, si renderà subito conto che sta succedendo il putiferio.
Non si capisce perchè ma Bing non rispetta le regole d’ esclusione delle pagine, scritte nei file Robots.txt, e capirete da voi che questo è un grave danno per molti webmaster, che quindi di conseguenza stanno intasando di lamentele il Forum d’assistenza di Bing senza ricevere però nessuna risposta.
Riporto alcune proteste (in inglese) che in questi giorni stanno riempiendo i forum di Bing-Msn:
envision_frodo dice:
Robots.txt example:
User-agent: *
Disallow: /forbidden/Log example:
65.55.106.209 – - [31/Aug/2009:16:53:15 -0600] “GET /robots.txt HTTP/1.1″ 200 294 “-” “msnbot/2.0b (+http://search.msn.com/msnbot.htm)”
65.55.106.209 – - [31/Aug/2009:16:54:03 -0600] “GET /legitpage1.php HTTP/1.0″ 200 14161 “-” “msnbot/2.0b (+http://search.msn.com/msnbot.htm)”
65.55.106.162 – - [31/Aug/2009:18:20:12 -0600] “GET /robots.txt HTTP/1.1″ 200 294 “-” “msnbot/2.0b (+http://search.msn.com/msnbot.htm)”
65.55.106.162 – - [31/Aug/2009:18:21:03 -0600] “GET /forbidden/ HTTP/1.0″ 403 3893 “-” “msnbot/2.0b (+http://search.msn.com/msnbot.htm)”
65.55.106.187 – - [31/Aug/2009:18:46:27 -0600] “GET /legitdir1/ HTTP/1.0″ 200 9835 “-” “msnbot/2.0b (+http://search.msn.com/msnbot.htm)”65.55.51.70 – - [02/Sep/2009:18:18:00 -0600] “GET /robots.txt HTTP/1.1″ 200 179 “-” “msnbot/2.0b (+http://search.msn.com/msnbot.htm)”
65.55.207.95 – - [02/Sep/2009:19:06:32 -0600] “GET /robots.txt HTTP/1.1″ 200 294 “-” “msnbot/2.0b (+http://search.msn.com/msnbot.htm)”
65.55.207.95 – - [02/Sep/2009:19:07:34 -0600] “GET /legitpage2.php HTTP/1.0″ 200 6494 “-” “msnbot/2.0b (+http://search.msn.com/msnbot.htm)”
65.55.51.70 – - [02/Sep/2009:19:27:45 -0600] “GET /robots.txt HTTP/1.1″ 200 179 “-” “msnbot/2.0b (+http://search.msn.com/msnbot.htm)”
65.55.106.138 – - [02/Sep/2009:20:24:36 -0600] “GET /forbidden/ HTTP/1.0″ 403 3893 “-” “msnbot/2.0b (+http://search.msn.com/msnbot.htm)”
65.55.207.120 – - [02/Sep/2009:20:33:05 -0600] “GET /legitpage3.phpforbidden/ HTTP/1.0″ 404 5514 “-” “msnbot/2.0b (+http://search.msn.com/msnbot.htm)”For clarity, logs have been modded as follows:
forbidden = Location or Honeypot (Should NOT be Spidered)
legitpage# = Legitimate Web Page (Should be Spidered)
legitdir# = Legitimate Directory/Folder (Should be Spidered)
nico7382 dice:
Sorry, I’m french
my “robots.txt”
User-agent: *
….
Disallow: /VoirSite.php
and on VoirSite.php, I added a script to trace visitor(log in file), and who I see?
DATE:2009-09-01 14:56:56, IP:65.55.105.141, AGENT:msnbot/1.1 (+http://search.msn.com/msnbot.htm), PAGE:/VoirSite
Why?
E questi sono solo alcune delle domande di chiarimento arrivate nel forum, ma ancora senza risposta.
Seguiremo la vicenda per voi e se ci saranno aggiornamenti e si risolvesse la questione, ve lo comunicheremo immediatamente.
NOTA: Per chi ha un file robots.txt senza esclusioni non ci sono problemi, del tipo:
User-agent: *
Disallow: /
Continuateci a seguire, per tutti gli aggiornamenti del caso.
Condividi questo post sui SocialBookmarks!
Articoli Correlati:
- Creare un file robots.txt per WordPress e non!
- BlackhatSEO:Indicizzare il tuo sito velocemente tramite siti con alto PR
- Google indicizza anche i feed Rss ed è sempre più real time!
- Google image search. Possiamo fidarci? Quanto è legale?
- Lista Forum con pagerank 6 e oltre. Tutti DoFollow!
-
Un webmaster












