Команда объединения файлов:
cat *.html > spisok.txt
Очистка html файла от тегов:
sed -e 's/<[^>]*>//g' spisok.txt
Удаляем пустые строки в файле:
perl -i -n -e "print if /s/" slova.txt
Удаляем повторяющиеся строки:
perl -ne 'print unless $a{$_}++^slova.txt > moy.txt
Открыть доступ к каталогу:
sudo chown -R whiterabbit /etc/scite