FULLSearch indexa páginas web cuyos dominios terminan en com.ar y/o que pertenecen a sitios destinados al usuario de habla hispana. Nuestro rastreador web recorre y analiza miles de páginas al día, incorporando nuevos contenidos y actualizando la información de la base de sitios del buscador.
Es muy importante que las páginas de tu sitio posean enlaces válidos a las diversas secciones del mismo, de lo contrario el rastreador de FULLSearch no podrá encontrar todas las páginas que lo componen. También puedes crear un mapa de tu sitio con enlaces a todos los documentos que lo integran.
FULLSearch detecta automáticamente aquellos sitios que poseen un SiteMap XML (más información) alojado en su directorio raíz, por ejemplo http://www.misitio.com.ar/sitemap.xml
Para verificar si tu sitio ya fue analizado por nuestro rastreador web sólo debes ingresar en la casilla de búsqueda la palabra site: seguida de la dirección principal de tu sitio.
EJEMPLOS
- site:http://www.fullservices.com.ar, muestra todas las páginas indexadas del dominio www.fullservices.com.ar.
- site:fullservices.com.ar, muestra todas las páginas indexadas del dominio fullservices.com.ar y sus subdominios.
Diariamente se añaden nuevos sitios a FULLSearch debido a que nuestro rastreador sigue los enlaces presentes en las páginas analizadas. Si aún tu sitio no fue indexado puedes solicitar su alta manualmente con sólo completar un simple formulario. Recuerda que sólo debes enviarnos la dirección web de la página (X)HTML principal; por otra parte, no garantizamos su inclusión en los resultados de búsqueda.
Si no deseas que tu sitio sea rastreado e indexado por FULLSearch sólo debes agregar las siguientes líneas al archivo robots.txt (más información sobre este archivo).
User-Agent: FULLSearch
Disallow: *
Recuerda que este archivo tiene que estar disponible en el directorio raíz del sitio, es decir, accesible desde http://www.misitio.com.ar/robots.txt.
Puedes evitar que FULLSearch rastree e indexe un directorio de tu sitio web con sólo agregar las siguientes líneas al archivo robots.txt:
User-Agent: FULLSearch
Disallow: /cgi-bin/
Esta configuración evitaría que se indexaran documentos del directorio /cgi-bin/, pero sí permitiría la indexación del resto de páginas y directorios del sitio web.
También FULLSearch tiene soporte para el filtrado de documentos web individuales. Por ejemplo, si deseas evitar que el rastreador indexe la página contacto.htm de tu sitio debes indicarlo así:
User-Agent: FULLSearch
Disallow: /contacto.htm
Nuevamente recuerda que el archivo robots.txt tiene que estar disponible en el directorio raíz del sitio.
No analizamos cada minuto los archivos robots.txt de los sitios web, por lo que si aplicas cambios a este archivo, los resultados de búsqueda se verán afectados hasta varios días después.