A shelter from pigs on the wing
DMZ
дневник заведен 09-08-2004
постоянные читатели [32]
3 CaHuTaPa, 517design, Arde, Art`Is, aviabaza, BlackDrago, CyberJoe, DeadMorozz, Depeche Mode, DMZ, d_r, Ewige, glv12 Marla Zinger, goldenandy, Grimble, Hydralisk, Jude, Katrine Himitsu, Leave-me-alone, MISTIK, My3a, Nash, Nicholas Hawkwood, Pingvin, Riskoff, VorteX DrAgON, Wolfram, Букля_, достало, Муть, Рика, Эль
закладки:
цитатник:
дневник:
местожительство:
Красноярск, Россия, Сибирь
интересы [24]
программирование, C++, Depeche Mode, Star Wars, perl, DVD, JavaScript, FAR, lost, 80е, Half Life 2, долго спать, Miami Vice, веб-роботы, кентаврицы
антиресы [9]
грибы, грейпфрутовый сок, мёртвые люди, табличка обед, долго спать
Пятница, 19 Октября 2007 г.
08:48 Программисткое... Fuzzy search, Perl-XS...
На днях сделал пару страшных вещей - собрал модули для PHP и Perl.
Немного по порядку и за жизнь...

Началось все это со сравнения строк. Строки - это очень страшные вещи на самом деле. Правда чтобы это понять, сначала надо вспомнить про обычные числа.
Вот все знают, что 2+2=4. И 4=4, а 5!=4. Сравнивать целые числы одно удовольствие.
А дальше будут числа вещественные и мнимые
Теперь, когда мы что-то поняли в сравнении чисел можно поговорить про строки. До этого мы работали с цифрами - и там было все просто с арифметикой. Но можно ли вычитать буквы? С одной стороны в компе строки - это набор битов и есть ASCII таблица. Далее строку можно рассматривать как n-мерный вектор кодов, где n-длина строки. Можно даже начать строить векторную алгебру на этом но... и как же сравнивают строки?
А теперь, собственно, задача и нафига мне этот нечеткий поиск понадобился.
Надо было мне написать поисковик по базе, который учитывал бы опечатки, пропавшие умляуты, битые артикли и прочее...
Часть следущая: Юникод, умляуты и транслит
Итак. У меня была строка без лишних символов. (А еще я вырезал артикли - это не сложно). Есть Левенштейн. ε я взял как четверть от максимальной строки + 1.
И с этими данными процесс пошел. Поиск работал очень неплохо. Сложная часть была позади - если надо добавить что-то в таблицу декомпозиции или подправить сравнение строк, то там уже чисто правка кода и ничего сложного.
В итоге я взял мою базу в SQLite 3 и стал думать как теперь сделать поиск по базе... Оказалось все просто - SQLite 3 можно создать свою функцию и SQL движок будет её использовать. Причем функция пишется не на SQL, а на Perl/PHP/C - смотря где пишешь. Так что вся мощь языка в твоих руках.
Как обычно сначала я начал с Perl-а:
Perl, скорость, C, PHP
Вот такая погоня за скоростью. Теперь можно это использовать в работе. Иногда добавляя что-нибудь в C-код. Еще неплохо бы написать скрипт, который компилит все три библиотеки сразу, чтобы не бегать по папкам и запускать.
Среда, 11 Апреля 2007 г.
18:48 LBA48
Человек создает себе проблемы.
Три месяца проработал у меня комп с винтом под 160 гиг... А ведь все знают, что выше 137 гиг кроются страшные проблемы! Просто так, после пересечения 137 гиг происходит переполнение буфера и начинается запись на начало диска. Там где MBR, таблица разделов, FAT первого раздела и.т.д.
Собственно вчера и пересек я эту границу. Хорошо что комп не основной и глюк ни к чему страшному не привел.
Винда, кстати стояла на втором разделе, так что смерть она не ощутила и жила себе спокойно.
После перезагрузки без MBR ничего не грузилось. И разделы все померли. Точнее таблица разделов.
Ну таблицу разделов я поднял через 10 минут. Данные на первом разделе померли - но там была Win98. Также умерли папки на последнем разделе - вылечилось фиксом файловой системы. Данные не востанавливал - важного там нет.
А вот с MBR и загрузкой винды промучался весь вечер. Мучал все утилиты (больше десятка) на LiveCD с виндой.
Может потому что винда стояла на втором разделе такие глюки...

В итоге сегодня вечером тупо поставил винду на первый раздел, она сделала себе MBR. Загрузился, поправил boot.ini руками и спокойно загрузился в старую винду - жива-живехонька.

Сразу подрубил поддержку LBA48 и теперь проблем быть не должно.

Теперь как избежать такой проблемы. Это конечно старый боян, но все же.
Итак. Во первых мать должна держать диски >137 гиг
Во вторых такой проблемы нет в WinXP+SP2, Win2k3, Vista.
В Win2k надо SP4 и ключик в реестре прописать (у меня был Sp4, но без ключика >_< )
Для WinXP, WinXPSP1 надо искать патч и мучать реестр.
В старых осях надо искать свои патчи.

И будьте осторожнее, когда идете в гости с таким винтом. Если там будет винда без поддержки LBA48 и будет попытка записи за границу 137 гиг - потом будет плохо =)
Четверг, 23 Ноября 2006 г.
15:51 Хостинг. Final
Итак, я заимел хостинг. У нас в России на караване

за 15$ в месяц почти все фичи, кроме всяких SSL премудростей, личного MySQL, ограничения по базам данных и коннектам к БД и FTP. Поддоменов и почты неограничено. Места на диске дали 200 метров. Если займу больше - буду платить сверху. Python, Perl, PHP, MySQL, gcc - всё для девелопера на месте.
Ну и самое хорошее - SSH доступ. Уже сижу в шелле юзаю WGET

Доменного имени красивого пока не купил. Потестим до Нового года, посмотрим как оно будем.
А пока - http://dmz.caravan.ru на халяву.

Щас надо поставить торрент скрипты и протестить. WGET льёт 25kbps. Ограничено сверху.
UPD - с другого сервака полился метр в секунду.

Ну еще RSS фиды буду писать. Но для начала надо проверить есть ли халявные библиотеки на PHP для генерирования RSS. Конечно русками я это и так успещно делаю, но все же есть некоторые подводные камни. Поэтому надо посмотреть что пользует народ.

Таакк... надо доставать с запыленых папок литературу по FreeBSD 6.0
Вторник, 7 Ноября 2006 г.
10:31 (X)HTML для чайнегов!
Собсно, баян:
Среда, 1 Ноября 2006 г.
13:45 XML, XSL, XPath
За ночь узнал поразительно много о сабже.
Вобщем была задача красиво отобразить некую XML. Список файлов с комментами.
Просто так браузеры его показывают как поппало. Opera - просто текст дампит. IE - раскрывающееся деревце рисует.

Вот для этого умные дядьки придумали XSL. Ну вроде как таблица стилей для XML.
Если на неё посмотреть по быстрому, то она просто позволяет преобразовывать XML теги в другие валидные XML-комбинации.
Так что можно спокойно XML конвертнуть в HTML, а точнее в XHTML.
При повторном взгляде открываются всякие интересные вещи типа переменных, шаблонов-макросов, условных операторов и прочего, что весьма плодотворствует полёту мысли.
Также можно пройти XML дважды. Например в первый раз вывести содержание файла, а при втором подходе собственно контент.

читать подробнее

Ну вот такая лекция получилась.
Четверг, 28 Сентября 2006 г.
07:58 Все тексты в гости к нам
Продолжение
Ну вот собвстенно и всё. Удачи в изучении текстов
07:53 Все тексты в гости к нам.
Вчера, одним вполне обычным осенним вечером я набрёл на один мега-плагин к Winamp-у, который называется WinLyrics. И до того он мне понравился, что решил я настрочить мануал, про то, как заюзать его мощь и силу в наших корыстных целях.
Как видно из названия, плагинчик что-то делает с текстами песен, а именно показывает их в своём окошке, да и, кроме того, может подсвечивать текущую строчку в песне, если есть временные метки. Для полного счастья он может тягать музыку аж из трёх источников: текстовый файл, тексты из тегов mp3 (не встречал такого на своей памяти), ну и самое приятное - из Интернета. Причем не просто из интернета, а из своей базы, которая, по заверениям на сайте, уже разрослась за 300 000 песен.
Мануал

продолжение
Четверг, 14 Сентября 2006 г.
06:36 Люминофоры, или как же всё таки строится изображение на мониторе.
Реальный монитор. Изучаем:



Только не переусердствуйте - глаза быстро устают.
Воскресенье, 3 Сентября 2006 г.
20:00
А еще я подсел на

img {padding:1px; background:white; border:1px solid black;}

жаль сюда не применишь.
Среда, 8 Марта 2006 г.
14:11 Апгрейд
Хммм... 8 марта, а я провел апгрейд компа. Куплен винт Seagate Baraccuda 7200 IDE 200Gb и оператива DDR 3200 400 Samsung 512Mb.
Итого у меня 410Gb (80+160+200-проценты) дискового пространства и 1Gb оперативы.
Еще была прикуплена флэшка SD Kingmax 256Mb для фотоаппарата.
За всё отдано 5 005р 40к. Всё было куплено без проблем в Комтеке, что в Торговом Центре (не путать с Торговым Кварталом).
Ценами доволен. Так что можете считать рекламой.
Закрыть