Die meisten Spameinträge in Gästebüchern, Foren etc. werden gemacht um auf Seiten zu verlinken, die dann irgend etwas verkaufen (Pornographie, Viagra, Beruhigungsmittel, etc.). Um auf eine andere Seite zu verlinken muss man einem Link einen Protokollteil voranstellen - das ist meistens "http://".
Normale Einträge enthalten selten mehr als einen, sehr selten mehr als zwei und fast nie mehr als drei Links zu externen Seiten (Natürlich gibt es Ausnahmen, gerade in Foren, aber für Gästebücher stimmt es in 99%)

Wenn der Eintrag mindestens 4 mal "http://" enthält ist es sicherlich Spam:
DELETE FROM some_guestbook WHERE ( (length(`text`) - length(REPLACE(`text`,'http://',''))) / length('http://') ) > 3

Erklärung wieso http und nicht https:
Natürlich könnte es auch "http
s://" sein, das ist jedoch sehr selten, weil es weil Nachteile für die Spammer hätte: 1. Sie benötigten ein gültiges Zertifikat, damit der Besucher keine Warnmeldung erhält. 2. Der Rechenaufwand pro Zugriff auf dem Server der Spammer würde sich erhöhen und damit die Kosten.