December 30th, 2013

Какой то очень грустный праздник получается

второй теракт за два дня не где-то там в Дагестане, и даже не в Северо-Кавказском городе (хотя теракты везде ужасны), а вполне себе в Повольжье, в Волгограде. Всё это уже приближается к ощущению сентября 1999 г. (там жертв было. конечно, больше, но сходство именно в частоте). И еще момент - тогда уже фактически шла Вторая Чеченская война, а сейчас же у нас всё ровно, застыло в стабильности и вертикале, и наверное украшен новогодними огоньками проспект Владимира Путина в Грозном. Откуда? Кто это делает? В любом случае, соболезную родственниками погибших. Хоть бы больше ничего не взрывали.  

Coursera

Последние два с половиной месяца, и последнюю праздничную неделю, решил на практике проверить дистанционное образование. Записался на ряд курсов на coursera, но полностью прошел пока только один - Data Analysis. Ведет его молодой ass.prof Jeff Leek из Johns Hopkins. В курсе лекции (слайды с комментариями). Всё очень быстро, но четко и понятно, с конкретными примерами и двумя практиками с реальными данными. Основы R (основные функции, подготовка данных к анализу), потом графики, linear models, GLM, ANOVA, bootstrap, smoothing, model checking and selection, simulations for model checking. Куча полезных ссылок и ряд бесплатных книг. Короче, советую для тех, кому нужно начинать с азов.



До этого я R использовал, но лишь для отдельных статистических тестов, но тут решил упорядочить до этого разрозненные знания, привести в систему. Там можно было сертификат получить, то так как по первому домашнему заданию я пропустил дедлайн (был на конференции), то просто просматривал видео и делал задания тогда, когда было время. Правильно говорят, что learning curve is very steep. Каждый раз думаешь, какой кодовый трюк лучше применить в данном случае, и желательно чтобы поменьше шагов. Возвращаешься к лекциям, гуглишь, лазаешь по книгам. Всё очень медленно и долго. Постепенно накапливаешь коды и быстрее понимаешь, что нужно делать, но еще до фига нужно учить и практиковаться, чтобы чувствовать себя с программой комфортно.

Еще предстоит изучения пакетов для GIS данных (map, gdal). Книжка Bivand et al. 2008 - Applied Spatial data Analysis with R есть (спасибо vlad-kosarev). Буду изучать. Если кому нужно - могу выслать. Есть одна биогеографическая идея, и есть куча shp файлов с ареалами. Сейчас немного практикуюсь в data munging ("причесывание", очистка и подготовка данных, как правильно сказал преп, ведущий курс, отнимает большую часть времени).