chron
19:06 13-03-2006 Креатив 2
Есть в Ворде такая возможность - посмотреть всякую дурацкую статистику, типа количества страниц, абзацев, предложений, слов, знаков (то есть для кого-то она не дурацкая, но не важно). А мне подумалось: а почему бы не дополнить ее статистикой по использованности каждой буквы в тексте, этаким спектром распределеня алфавита в документе? И на его основе исследовать большие тексты знаменитых писателей: похожи эти распределения у них на писанину простых смертных, или у каждого свой спектр? Насколько, интересно, он гладок, насколько остро вздымаются пики букв "о" и "а", насколько велики провалы "щ" и "ъ"? Кто б такое сделал?
Комментарии:
sanya
19:11 13-03-2006
5, нуууу 10 минут
sanya
19:29 13-03-2006
Меня, конечно, начинает сразу дергать на параллели. Приступим:
1. Сравнение спектров автора в возбужденном состоянии и основном.
2. Спектры переходов состояний.
3. Энергия возбуждения (выраженная в литрах, граммах и так далее).
4. Спектры поглощения.
5. Определение автора по спектру - само собой. А также идентификация состава смеси по суммарному спектру (см. теорему про разложение автора на параметры).

Математическое продолжение:
1. Разложение спектра на составляющие.
2. Доказательство теоремы о том, что спектр любого автора можно с довольно хорошей точностью представить как суперпозиция базисных спектров и, как следствие, представление спектра автора набором нескольких параметров.

Медицинское (хотя, чувствую забираю не в свою стезю):
1. Определение псих. отклонений автора по аномальным параметрам спектра (см. выше).
И так далее... Бреду конец.
chron
19:45 13-03-2006
sanya
Это уже ты перечисляешь прикладные применения новой технологии. Меня же пока интересует просто воплощение ее в жизнь.
Спектры поглощения - муторно, хотя возможно и доступно только владельцам КПК.
Энергия возбуждения - очень муторно и боюсь невозможно, т.к. литры с граммами могу смешаться и получится ерунда.
А самый простой полный набор базисных спектров - это дельта-функция для каждой из букв алфавита.

в общем, от имени и по поручению выражаю благодарность за поддержку идеи
sanya
20:58 13-03-2006
Меня же пока интересует просто воплощение ее в жизнь.
chron, читай мой первый комент.
sanya
21:03 13-03-2006
А самый простой полный набор базисных спектров - это дельта-функция для каждой из букв алфавита.
Да, chron, самый простой, я об этом подумал, но не оптимальный при разложении! Может спектр будет расскладываться достаточно хорошо на базе 5-6 базисных спектров! Вот это тогда будет открытие. Главное хорошую матрицу поворота базиса составить.
sanya
21:09 13-03-2006
chron ты вот прости меня, дуру грешную, я вот намереваюсь перечитать все твои посты с самого начала, видимо буду везде коменты вставлять. Будет у тебя пресс-конференция.
joujou
23:06 13-03-2006
chron статистика вовсе не дурацкая. за количество знаков и слов платят
chron
01:59 14-03-2006
sanya
читай мой первый комент
а, так он про время делания! я думал, ты подождать просишь и потом ответишь )
заняться, что ли.. давно ничего не программировал..

Может спектр будет расскладываться достаточно хорошо на базе 5-6 базисных спектров!
Все возможно. Но что-то мне начинает казаться, что различия при хорошей статистике будут очень маленькими, проверить надо.

Будет у тебя пресс-конференция.
у, ну удачи ))

joujou
Да, я же так и написал: для кого-то она не дурацкая )
*ты свой J навсегда того, или вернешься?
joujou
12:28 14-03-2006
chron а ты не знаешь, как его можно сохранить себе со всеми комментами?
chron
15:54 14-03-2006
joujou
знающие люди советую Teleport Pro
sanya
20:05 14-03-2006
chron мне стыдно. Кажется я был не прав. Сейчас попробую посмотреть конечно еще раз, но кажется я зря пальцы выгибал.
sanya
20:53 14-03-2006
chron
Есть у меня утешающие новости. Делается это так: берется Teleport Pro, пихается ему адрес http://www.journals.ru/users/chron (например), ставить глубина хождения по ссылка до 2х шагов (этого хватает, чтобы зайти на любую из страниц постов - один шаг, в списке постов зайти на любую страницу коментов - второй), пишев в исключения список шаблонов урлов по которым ходить не надо (определяется опытным путем, у меня получилось 12 шаблонов, кому интересно, дам) и запускается перекачка.
Сейчас скачиваю для науки твой Ж. Блин, еще одну страничку надо в исключения занести, заново. Процесс по настройкам муторный, но потом идет сам как по маслу. И ссылки работают верно после выкачивания.
chron
21:36 14-03-2006
sanya
Поделишься потом с joujou наукой? ))
Вообще клево. Вот ты разработаешь сейчас методику, и потом можешь ее презентовать на день рожденья Дж. и Камрада админам, они ее в ФАК занесут
sanya
22:14 14-03-2006
chron а господам ФАКерам-админам (которые занимаются ФАКом) я бы порекомендовал сделать такую фичу как сохранить свой Ж локально, а также прикруить RSS!
C joujou поделюсь.
chron
23:50 14-03-2006
sanya
К ним с такими предложениями обращались, но они отмазывались. Если не лень, почтиай комменты к support.
sanya
00:41 15-03-2006
а, так он про время делания! я думал, ты подождать просишь и потом ответишь )
заняться, что ли.. давно ничего не программировал..

chron
1. Дай два текста на пробу
2. И не советую. Написание подобной проги не на Perl сравнимо с рожанием ежей
chron
01:26 15-03-2006
sanya
1. Э?
2. Ага, я на бейсике хочу. А чего, сделать только для ASCII кода и не мучиться.
sanya
01:45 15-03-2006
chron
1. Я тут коментю, а ты отвечаешь! А мне еще надо не сбиться с порядком чтения постов. Так ведь вообще головою тронусь тут.
2. Сбился со счета! Считай что это первый пункт, а предыдущий был нулевой. Хочу два спектра построить.
3. Да в общем, городить там особо нечего. А картинки у тебя прога строить будет?
chron
01:55 15-03-2006
sanya
1. Ну извините ))
2. Либ.ру к твоим услугам. Возьми, например, Героя нашего времени М. Лермонтова и.. м.. Географ глобус проипл А. Иванова.
3. В ТЗ это быть должно )