Как я уже неоднократно упоминал, не люблю пользоваться в своих проектах сторонними наработками. Но тут все же решил использовать
Simple HTML DOM Parser. Потому как парсить HTML на PHP своими силами - дело не из приятных, будь то через DOM, или же при помощи regexp'ов. Simple HTML DOM Parser же позволяет использовать синтакс, знакомый по jQuery.
Необходимо учитывать, что simple_html_dom() крайне прожорлив. Так что перед использованием стоит выделить ему памяти:
ini_set("memory_limit", "64M");
И после каждого использования - уничтожать:
$html->__destruct();
unset($html);