Něco jako
Kód: Vybrat vše
#root@lori:/
tree /fo/hospodareni2015/rozpocty > struktura.txtDěkuji za pochopení, ochotu a rychlé zpracování.
Moderátor: Odbor - technicky
Kód: Vybrat vše
#root@lori:/
tree /fo/hospodareni2015/rozpocty > struktura.txtNejraději bych fakt názvy souborů v celém jmenném prostoru. Například smazané stránky nevidím vůbec a v /fo/ se dělalo spousta změn, nejen za mě a nedělal jsem to jen já. Seznam by mi sloužil i k vyčištění wiki.Vojtech.Pikal píše:Čili potřebuješ ID stránek rozpočtových položek?
Jinak řečeno, použitá čísla stránek rozpočtových položek?
Kód: Vybrat vše
sudo apt-get install treeKód: Vybrat vše
curl http://www.pirati.cz/?do=sitemap | gunzip | grep -o '/fo/hospodareni2014/rozpocty.*' | rev | cut -b 7- | rev
Kód: Vybrat vše
curl https://www.pirati.cz/?do=sitemap | gunzip | grep -o '/fo/hospodareni2015.*' | rev | cut -b 7- | revKód: Vybrat vše
#!/usr/bin/env perl
use strict;
use WWW::Curl::Easy;
use XML::XPath;
use XML::XPath::XMLParser;
use Compress::Zlib;
use String::Escape qw(quote);
my $curl = WWW::Curl::Easy->new();
my $ret;
$curl->setopt(CURLOPT_URL, 'https://www.pirati.cz/?do=sitemap');
$curl->setopt(CURLOPT_WRITEDATA,\$ret);
my $retcode = $curl->perform;
if ($retcode == 0) {
my $out;
my $z = new IO::Uncompress::Gunzip \$ret;
$z->read($out, 100000000000000000);
my $xp = XML::XPath->new($out);
my $nodeset = $xp->find('/urlset/url/loc[contains(text(),' . quote($ARGV[0]). ')]/child::text()');
foreach my $node ($nodeset->get_nodelist) {
print STDOUT XML::XPath::XMLParser::as_string($node) , "\n";
}
}