Kategorien
Programmierung

Textformatierung aus der Zwischenablage entfernen

Die Funktionalität von stripClip, einem kleinen Utility zum Entfernen von Textformatierungen  aus der Zwischenablage lässt sich – sofern sowieso ein Perl-Interpreter installiert ist – auch mit wenigen Zeilen Perl-Code realisieren:

use warnings;
use strict;
use Win32::Clipboard;

my($text);

my $clip = Win32::Clipboard();

do {

	$clip->WaitForChange();

	if ($clip->IsText()) {
		$text = $clip->GetText();
		$clip->Set($text);
	}

} while ($text ne ':q');

Startet man das Skript mit ‚wperl.exe‘ statt mit ‚perl.exe‘, stört kein Fentser und das Skript lässt sich ohne Taskmanager durch Kopieren von ‚:q‘ beenden.

Kategorien
Programmierung

Windows, Geplante Tasks, Perl und ARGV

Ein logischer Grund ist nicht ersichtlich, aber während der „Geplante Task“ beim Aufruf

c:\perl\bin\wperl.exe c:\meinskript.pl tollerparameter

den tollen Parameter ans Skript weiterreicht, wird mittels

c:\meinskript.pl tollerparameter

zwar das Skript aufgerufen, der Parameter kommt aber nicht an.

Kategorien
Programmierung

Module mit ppm aktualisieren

Während die Aktualisierung der vorhandenen Module über die graphische Oberfläche von ppm zur Klickarie ausartet, hilft die Kommandozeile schnell und unbürokratisch:

ppm upgrade --install

wühlt sich vom ersten bis zum letzten installierten Modul und aktualisiert diese bei Bedarf.

Kategorien
Programmierung

HTML-Dokumente zerlegen mit HTML::TreeBuilder

Geht es um das Extrahieren von Informationen aus einem HTML-Dokument, so bietet sich Perl als „the Swiss Army chainsaw of programming languages“ geradezu an und bietet unzählige Wege ans Ziel. Nicht nur gibt es die mächtige RegEx-Engine, auch im CPAN gibt es eine Vielzahl von Modulen, die für den Einsatzzweck geeignet scheinen.

Ein Modul, das ein gutes Verhältnis zwischen Aufwand und erzieltem Ergebnis verspricht, ist HTML::TreeBuilder, dessen Einsatz am Beispiel eines Flickr-Fotoalbums demonstriert werden soll:

Nach der Initialisierung des HTML::TreeBuilder-Objekts genügt ein Aufruf von „parse“ oder wahlweise „parse_file“ auf eine z.B. mittels „LWP::Simple“ heruntergeladene Datei, damit der HTML-Tree zur weiteren Verarbeitung zur Verfügung steht.

$tree = HTML::TreeBuilder->new;
$tree->parse($page);

Die einzelnen Thumbnails eines Albums sind bei flickr jeweils in ein „div“-Element eingebettet, dem die Klasse „thumb“ zugewiesen ist.

<div class="thumb">
    <span>
        <a title="..." href="...">
            <img width="75" height="75" border="0" alt="..." src="...">
        </a>
    </span>
</div>

Um eine Liste aller Thumbnail-Elemente zu erhalten, genügt der Aufruf von „find_by_attribute“ mit passenden Parametern

@urllist = $tree->find_by_attribute('class', 'thumb');

der den gesamten Dokument-Tree durchläuft und eine Liste aller Elemente mit Klasse „thumb“ zurückliefert, die dann einzeln abgearbeitet werden können.

Die Links zu den jeweiligen Bilderseiten können dann über den Aufruf zweier weiterer Funktionen etxrahiert werden:

foreach $thumb (@urllist) {

    $link = $thumb->find_by_tag_name('a');
    print $link->attr('href');
}

Der Aufruf von „find_by_tag_name“ lokalisiert das Link-Element innerhalb des „div“-Elements, mittels „attr“ kann auf dessen „href“-Attribut zugegriffen werden.

Das vollständige Beispielskript, das mittels

flickldr.pl http://www.flickr.com/photos/<werauchimmer>/sets/<wasauchimmer>/

aufgerufen wird, ist lediglich als Demo zur Verwendung von HTML::Template zu sehen und alles andere als ein zuverlässiger Downloader für Flickr-Alben. Neben fehlendem Fehlerhandling gibt es auch keinerlei Option(en) zur Wahl der Fotogröße – es wird einfach davon ausgegangen, daß alles wie gewünscht verfügbar ist.

Hinweis: Seit dem Relaunch von Flickr am 20. Mai 2013 können mit dem Skript keine Alben mehr heruntergeladen werden.

Kategorien
Programmierung

Exif-Daten ändern

Sollen Exif-Daten vorhandener Bild-Dateien geändert werden, so ist – wie so oft im adminstrativen Alltag – PERL ein hilfreiches Werkzeug.

Folgendes Skript schnappt sich alle „JPG“-Dateien im aktuellen Verzeichnis und setzt deren Aufnahmedatum auf den 01.09.2004 9:22:57 Uhr.

use strict;
use warnings;
use Image::ExifTool;

my (@files, $file, $image, $success);

opendir(DIR, '.');
@files = readdir(DIR);
closedir(DIR);

foreach $file (@files) {

 next if $file !~ /\.jpg$/i;

 print "processing file '$file'\n";

 my $image = new Image::ExifTool;

 $image->SetNewValue('DateTimeOriginal', '2004:09:01 09:22:57');
 $success = $image->WriteInfo($file, '_' . $file);

 die 'Error: \'' . $image->GetValue('Error') . '\'' if ! $success;
}

Die komplette Doku zu Image::ExifTool findet sich im CPAN. Wer mutig ist (oder ein Backup hat), kann den zweiten Parameter bei WriteInfo auch weglassen – die Quelldatei wird dann direkt überschrieben.