Jak rychle přidat stránky do Seznam indexu

29. listopadu 2013 v 11:49
V předchozím článku o budování obsahového webu jsem zmínil hromadné přidání stránek do seznamáckého indexu. V krátkosti představím, jak aktuálně celkem rychle dostávám nové stránky do indexu.



Díky fungování formuláře (poslání url přes GET) je to velmi jednoduché.

Mám nastavený CRON, který každý den v určitý čas spustí skript. Šlo by to udělat i v momentě vydání článku, ale přes CRON mohu sledovat, kdy je přidání nejlepší (kdy objevení stránky v indexu přivede okamžitě nějaké návštěvníky). V tomto skriptu je jen pár řádků. V podstatě jde jen o to, zjistit url adresu nového článku a tu poslat do formuláře na přidání stránky.

Minimalistická verze vypadá takto:

file_get_contents("http://search.seznam.cz/pridej-stranku?url=$url");

kde $url je kompletní adresa nového článku/podstránky, např. http://www.example.com/category/date/article. Jak zjistit $url se liší podle použitého redakčního systému.

Na začátku jsem měl poměrně sofistikovanou verzi skriptu, která kontrolovala úspěšnost přidání (stránka vrací proměnnou STATUS s hodnotou 200 (http://search.seznam.cz/pridej-stranku?status=200), na stránku jsem přistupoval přes CURL a v CURLOPT_PROXY jsem měl nějaké české free proxy/tor. To jsem ale zrušil, protože proxy jsou pomalé a hlavně moji IP nikdo nezabanoval, ikdyž jsem do formuláře poslal několik tisíc stránek najednou ;-).

Počítám, že jakmile se jednoduché řešení přidání stránek rozšíří, tak Seznam pozmění formulář. Přejde na metodu POST a omezí počet přístupů z IP. Ale třeba ne ;-).
 

Buď první, kdo ohodnotí tento článek.

Komentáře

1 Jan P. Jan P. | 29. listopadu 2013 v 19:26 | Reagovat

Škoda, že už je to venku :) Ale i na POST půjde udělat skript:)

2 vB vB | Web | 3. prosince 2013 v 11:10 | Reagovat

Odeslání formuláře metodou POST se dá snadno zajistit přes CURL. Nicméně, nedávno jsem si taky napsal skript a poslal přes něj sadu adres, ale do dnešního dne se do indexu nezařadily. Tobě se všechny odeslané URL přidaly?

3 panzero panzero | Web | 3. prosince 2013 v 13:43 | Reagovat

Ano, zatím se všechny poslané stránky v indexu objevují. Respektive, když to kontroluji, tak stránky z toho dne tam jsou a celkový počet indexovaných stránek roste.

4 hups hups | E-mail | 3. prosince 2013 v 18:02 | Reagovat

Seznam je divný. U Google jsem do 30 minut aniž bych o něco škemral. Seznam u mě každý den stáhne desetitisíce stran a jejich zpracování mu trvá víc než 14 dnů. Nechápu.

5 Tomáš Tomáš | E-mail | 22. prosince 2015 v 10:52 | Reagovat

Dobrý den,

je tento skript ještě funkční?

Placeně bych ho upotřebil.

Děkuji

Nový komentář

Přihlásit se
  Ještě nemáte vlastní web? Můžete si jej zdarma založit na Blog.cz.
 

Aktuální články

Reklama