<?xml version='1.0' encoding='UTF-8'?><?xml-stylesheet href="http://www.blogger.com/styles/atom.css" type="text/css"?><feed xmlns='http://www.w3.org/2005/Atom' xmlns:openSearch='http://a9.com/-/spec/opensearchrss/1.0/' xmlns:georss='http://www.georss.org/georss' xmlns:gd='http://schemas.google.com/g/2005' xmlns:thr='http://purl.org/syndication/thread/1.0'><id>tag:blogger.com,1999:blog-130719118122223661</id><updated>2011-07-28T17:21:07.816+04:00</updated><category term='the best'/><category term='packages'/><category term='visualization'/><category term='забавно'/><category term='books'/><category term='intro'/><category term='programming'/><category term='XML'/><category term='web harvesting'/><category term='scans (пиратчина)'/><category term='links'/><category term='projecteuler.net'/><category term='R as a language'/><category term='infographic'/><category term='netflix contest'/><category term='jquery'/><category term='Vim'/><category term='RCP'/><category term='10G'/><category term='lazy list'/><category term='tail recursion'/><category term='som'/><category term='kernels'/><category term='memo'/><category term='numbers'/><category term='comments'/><category term='lazy evaluation'/><category term='уважаю'/><title type='text'>r-labs</title><subtitle type='html'></subtitle><link rel='http://schemas.google.com/g/2005#feed' type='application/atom+xml' href='http://r-labs.blogspot.com/feeds/posts/default'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default?max-results=100'/><link rel='alternate' type='text/html' href='http://r-labs.blogspot.com/'/><link rel='hub' href='http://pubsubhubbub.appspot.com/'/><author><name>r_labs</name><uri>http://www.blogger.com/profile/02153101675637572811</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='16' height='16' src='http://img2.blogblog.com/img/b16-rounded.gif'/></author><generator version='7.00' uri='http://www.blogger.com'>Blogger</generator><openSearch:totalResults>31</openSearch:totalResults><openSearch:startIndex>1</openSearch:startIndex><openSearch:itemsPerPage>100</openSearch:itemsPerPage><entry><id>tag:blogger.com,1999:blog-130719118122223661.post-4101925547122919466</id><published>2010-03-03T20:42:00.007+03:00</published><updated>2010-03-04T23:49:23.526+03:00</updated><category scheme='http://www.blogger.com/atom/ns#' term='забавно'/><category scheme='http://www.blogger.com/atom/ns#' term='уважаю'/><title type='text'>Мобильный интернет</title><summary type='text'>
Подвалило мне тут счастье в виде pcap дампа. Играюсь понемногу. Вот статистика GPRS трафика у одного из операторов "тройки":

Чем эта диаграмма интересна: +3 это, в действительности, +30 - номера германские, а +4 - это +44 (Великобритания), +7 - Россия. По оси абцисс - в некотором смысле мера активности использования услуги. Получается, в основном мобильным интернетом пользуются иностранцы, что </summary><link rel='replies' type='application/atom+xml' href='http://r-labs.blogspot.com/feeds/4101925547122919466/comments/default' title='Комментарии к сообщению'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment.g?blogID=130719118122223661&amp;postID=4101925547122919466' title='Комментарии: 0'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/4101925547122919466'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/4101925547122919466'/><link rel='alternate' type='text/html' href='http://r-labs.blogspot.com/2010/03/blog-post.html' title='Мобильный интернет'/><author><name>r_labs</name><uri>http://www.blogger.com/profile/02153101675637572811</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='16' height='16' src='http://img2.blogblog.com/img/b16-rounded.gif'/></author><media:thumbnail xmlns:media='http://search.yahoo.com/mrss/' url='http://1.bp.blogspot.com/_GRuOVxcYiO0/S46gSusOIFI/AAAAAAAAADs/rblzvoip8mQ/s72-c/phones.GIF' height='72' width='72'/><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-130719118122223661.post-4325384838529354478</id><published>2009-08-26T14:42:00.012+04:00</published><updated>2009-09-04T14:21:08.816+04:00</updated><category scheme='http://www.blogger.com/atom/ns#' term='забавно'/><category scheme='http://www.blogger.com/atom/ns#' term='10G'/><category scheme='http://www.blogger.com/atom/ns#' term='уважаю'/><title type='text'>Этот год прошёл бестолково</title><summary type='text'>
Этот год прошёл бестолково. Из универа ушёл, занимался всякой фигнёй за еду. Единственное маленькое достижение - спроектировал программно - аппаратную систему для фильтрации в 10G и более Ethernet сетях. Но она, похоже, не будет реализована. Я уже написал модель на SystemC, осталось закончить окружение и тесты. Если не удастся продать алгоритм / модель за поездку в Перу и если знакомые FPGA </summary><link rel='replies' type='application/atom+xml' href='http://r-labs.blogspot.com/feeds/4325384838529354478/comments/default' title='Комментарии к сообщению'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment.g?blogID=130719118122223661&amp;postID=4325384838529354478' title='Комментарии: 0'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/4325384838529354478'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/4325384838529354478'/><link rel='alternate' type='text/html' href='http://r-labs.blogspot.com/2009/08/blog-post.html' title='Этот год прошёл бестолково'/><author><name>r_labs</name><uri>http://www.blogger.com/profile/02153101675637572811</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='16' height='16' src='http://img2.blogblog.com/img/b16-rounded.gif'/></author><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-130719118122223661.post-3561656296586270507</id><published>2009-02-13T17:19:00.001+03:00</published><updated>2009-02-13T17:21:34.128+03:00</updated><category scheme='http://www.blogger.com/atom/ns#' term='infographic'/><category scheme='http://www.blogger.com/atom/ns#' term='забавно'/><category scheme='http://www.blogger.com/atom/ns#' term='visualization'/><title type='text'>Paper-Based Visualization Competition: The Winner and More</title><summary type='text'>Paper-Based Visualization Competition: The Winner and More</summary><link rel='replies' type='application/atom+xml' href='http://r-labs.blogspot.com/feeds/3561656296586270507/comments/default' title='Комментарии к сообщению'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment.g?blogID=130719118122223661&amp;postID=3561656296586270507' title='Комментарии: 0'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/3561656296586270507'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/3561656296586270507'/><link rel='alternate' type='text/html' href='http://r-labs.blogspot.com/2009/02/paper-based-visualization-competition.html' title='Paper-Based Visualization Competition: The Winner and More'/><author><name>r_labs</name><uri>http://www.blogger.com/profile/02153101675637572811</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='16' height='16' src='http://img2.blogblog.com/img/b16-rounded.gif'/></author><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-130719118122223661.post-5365265007822792335</id><published>2008-09-30T14:04:00.004+04:00</published><updated>2008-09-30T14:06:23.219+04:00</updated><category scheme='http://www.blogger.com/atom/ns#' term='comments'/><category scheme='http://www.blogger.com/atom/ns#' term='забавно'/><category scheme='http://www.blogger.com/atom/ns#' term='numbers'/><title type='text'>The Lost Numbers</title><summary type='text'>
В справочнике по целочисленным последовательностям, чего только не найдёшь.
The Lost Numbers
</summary><link rel='replies' type='application/atom+xml' href='http://r-labs.blogspot.com/feeds/5365265007822792335/comments/default' title='Комментарии к сообщению'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment.g?blogID=130719118122223661&amp;postID=5365265007822792335' title='Комментарии: 0'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/5365265007822792335'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/5365265007822792335'/><link rel='alternate' type='text/html' href='http://r-labs.blogspot.com/2008/09/lost-numbers_30.html' title='The Lost Numbers'/><author><name>r_labs</name><uri>http://www.blogger.com/profile/02153101675637572811</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='16' height='16' src='http://img2.blogblog.com/img/b16-rounded.gif'/></author><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-130719118122223661.post-2370381289078273729</id><published>2008-09-25T23:08:00.002+04:00</published><updated>2008-09-25T23:11:46.073+04:00</updated><category scheme='http://www.blogger.com/atom/ns#' term='comments'/><category scheme='http://www.blogger.com/atom/ns#' term='забавно'/><title type='text'>"Все жители Крита - лжецы"...</title><summary type='text'>
Оказывается известная антиномия "Все жители Крита - лжецы" от критянина Епименида в полном варианте звучит так: "Все жители Крита лжецы, скверные животные, ленивые утробы". Вот так! Этот Епименид у них, похоже, был не логиком, а кем - то вроде дессидента. Епименид - отец дессидентства!
</summary><link rel='replies' type='application/atom+xml' href='http://r-labs.blogspot.com/feeds/2370381289078273729/comments/default' title='Комментарии к сообщению'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment.g?blogID=130719118122223661&amp;postID=2370381289078273729' title='Комментарии: 0'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/2370381289078273729'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/2370381289078273729'/><link rel='alternate' type='text/html' href='http://r-labs.blogspot.com/2008/09/blog-post.html' title='&quot;Все жители Крита - лжецы&quot;...'/><author><name>r_labs</name><uri>http://www.blogger.com/profile/02153101675637572811</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='16' height='16' src='http://img2.blogblog.com/img/b16-rounded.gif'/></author><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-130719118122223661.post-627587955603822271</id><published>2008-08-28T12:09:00.002+04:00</published><updated>2008-08-28T12:58:04.981+04:00</updated><category scheme='http://www.blogger.com/atom/ns#' term='comments'/><title type='text'>О программировании</title><summary type='text'>
Шесть мартышек, может быть, и напечатают Шекспира за миллион лет, а
вот создать хороший программный код у них вряд ли получится....
</summary><link rel='replies' type='application/atom+xml' href='http://r-labs.blogspot.com/feeds/627587955603822271/comments/default' title='Комментарии к сообщению'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment.g?blogID=130719118122223661&amp;postID=627587955603822271' title='Комментарии: 0'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/627587955603822271'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/627587955603822271'/><link rel='alternate' type='text/html' href='http://r-labs.blogspot.com/2008/08/blog-post_28.html' title='О программировании'/><author><name>r_labs</name><uri>http://www.blogger.com/profile/02153101675637572811</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='16' height='16' src='http://img2.blogblog.com/img/b16-rounded.gif'/></author><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-130719118122223661.post-225526799032032146</id><published>2008-08-14T21:14:00.004+04:00</published><updated>2008-08-14T21:24:02.911+04:00</updated><category scheme='http://www.blogger.com/atom/ns#' term='scans (пиратчина)'/><title type='text'>Наглядная математическая статистика</title><summary type='text'>
Несколько глав из "Наглядной математической статистики: ch04.djvu ... ch08.djvu. Это теория. Практические главы во второй части. Я их, может быть, позже отсканирую. 
</summary><link rel='replies' type='application/atom+xml' href='http://r-labs.blogspot.com/feeds/225526799032032146/comments/default' title='Комментарии к сообщению'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment.g?blogID=130719118122223661&amp;postID=225526799032032146' title='Комментарии: 0'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/225526799032032146'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/225526799032032146'/><link rel='alternate' type='text/html' href='http://r-labs.blogspot.com/2008/08/blog-post.html' title='Наглядная математическая статистика'/><author><name>r_labs</name><uri>http://www.blogger.com/profile/02153101675637572811</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='16' height='16' src='http://img2.blogblog.com/img/b16-rounded.gif'/></author><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-130719118122223661.post-339081738497847267</id><published>2008-08-05T18:30:00.003+04:00</published><updated>2009-02-13T17:16:34.205+03:00</updated><category scheme='http://www.blogger.com/atom/ns#' term='memo'/><category scheme='http://www.blogger.com/atom/ns#' term='R as a language'/><title type='text'>.Last.value</title><summary type='text'>
Ну вот и пригодилось! ) 
Запустил hclust в top-level. Полчаса программа чего - то шуровала в свопе и затем счастливо сообщила:

Call:
hclust(d = dist(tdm), method = "ward")

Cluster method   : ward 
Distance         : euclidean 
Number of objects: 468 

От повторного запуска меня спасло .Last.value
</summary><link rel='replies' type='application/atom+xml' href='http://r-labs.blogspot.com/feeds/339081738497847267/comments/default' title='Комментарии к сообщению'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment.g?blogID=130719118122223661&amp;postID=339081738497847267' title='Комментарии: 0'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/339081738497847267'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/339081738497847267'/><link rel='alternate' type='text/html' href='http://r-labs.blogspot.com/2008/08/lastvalue.html' title='.Last.value'/><author><name>r_labs</name><uri>http://www.blogger.com/profile/02153101675637572811</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='16' height='16' src='http://img2.blogblog.com/img/b16-rounded.gif'/></author><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-130719118122223661.post-5796013740730843448</id><published>2008-08-01T22:10:00.006+04:00</published><updated>2008-08-05T18:48:55.778+04:00</updated><category scheme='http://www.blogger.com/atom/ns#' term='memo'/><category scheme='http://www.blogger.com/atom/ns#' term='kernels'/><title type='text'>Десятый день (string kernel)</title><summary type='text'>
ЗАДАЧА

Поставлена задача - сравнение слов, из - за орфографических ошибок или применения различных схем транслитерации незначительно различающихся в написании. Обычно эти слова - имена собственные, например, фамилии и имена индийских программистов / богов.

РЕШЕНИЕ

Есть идея - использовать метрический подход. Меру схожести можно задавать по - разному, но я не буду "изобретать велосипед", а </summary><link rel='replies' type='application/atom+xml' href='http://r-labs.blogspot.com/feeds/5796013740730843448/comments/default' title='Комментарии к сообщению'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment.g?blogID=130719118122223661&amp;postID=5796013740730843448' title='Комментарии: 0'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/5796013740730843448'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/5796013740730843448'/><link rel='alternate' type='text/html' href='http://r-labs.blogspot.com/2008/08/lt.html' title='Десятый день (string kernel)'/><author><name>r_labs</name><uri>http://www.blogger.com/profile/02153101675637572811</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='16' height='16' src='http://img2.blogblog.com/img/b16-rounded.gif'/></author><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-130719118122223661.post-9158915505503806813</id><published>2008-07-22T11:11:00.012+04:00</published><updated>2008-07-22T12:50:24.497+04:00</updated><category scheme='http://www.blogger.com/atom/ns#' term='уважаю'/><category scheme='http://www.blogger.com/atom/ns#' term='books'/><title type='text'>Вероятность и статистика в примерах и задачах</title><summary type='text'>

Формально вот отрывок из аннотации к книге:
 Для освоения теории вероятностей и математической статистики тренировка в решении задач и выработка интуиции важны не меньше, чем изучение доказательств теорем; большое разнообразие задач по этому предмету затрудняет студентам переход от лекций к экзаменационным задачам, а от них - к практике. ... Необходимые теоретические сведения приводятся по ходу</summary><link rel='replies' type='application/atom+xml' href='http://r-labs.blogspot.com/feeds/9158915505503806813/comments/default' title='Комментарии к сообщению'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment.g?blogID=130719118122223661&amp;postID=9158915505503806813' title='Комментарии: 0'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/9158915505503806813'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/9158915505503806813'/><link rel='alternate' type='text/html' href='http://r-labs.blogspot.com/2008/07/blog-post_22.html' title='Вероятность и статистика в примерах и задачах'/><author><name>r_labs</name><uri>http://www.blogger.com/profile/02153101675637572811</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='16' height='16' src='http://img2.blogblog.com/img/b16-rounded.gif'/></author><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-130719118122223661.post-5168499633096420871</id><published>2008-07-11T15:17:00.006+04:00</published><updated>2008-07-22T19:31:08.749+04:00</updated><category scheme='http://www.blogger.com/atom/ns#' term='memo'/><category scheme='http://www.blogger.com/atom/ns#' term='numbers'/><title type='text'>Повода для паники нет!</title><summary type='text'>
Из - за ошибки в генераторе случайных чисел для протокола DNS, многие, в том числе и корневые сервера были уязвимы. Подробности здесь и здесь.  Пишут - повода для паники нет. Удивительно, сколь долго такая коварная ошибка оставалась незамеченной.

Развёрнутый доклад об уязвимости Камински представит на blackhat.
</summary><link rel='replies' type='application/atom+xml' href='http://r-labs.blogspot.com/feeds/5168499633096420871/comments/default' title='Комментарии к сообщению'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment.g?blogID=130719118122223661&amp;postID=5168499633096420871' title='Комментарии: 0'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/5168499633096420871'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/5168499633096420871'/><link rel='alternate' type='text/html' href='http://r-labs.blogspot.com/2008/07/blog-post.html' title='Повода для паники нет!'/><author><name>r_labs</name><uri>http://www.blogger.com/profile/02153101675637572811</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='16' height='16' src='http://img2.blogblog.com/img/b16-rounded.gif'/></author><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-130719118122223661.post-2943979950679058048</id><published>2008-06-11T10:23:00.004+04:00</published><updated>2008-07-11T15:16:54.308+04:00</updated><category scheme='http://www.blogger.com/atom/ns#' term='the best'/><category scheme='http://www.blogger.com/atom/ns#' term='уважаю'/><category scheme='http://www.blogger.com/atom/ns#' term='books'/><category scheme='http://www.blogger.com/atom/ns#' term='links'/><title type='text'>Математические методы обучения по прецедентам</title><summary type='text'>
Отличный курс лекций: http://www.ccas.ru/voron/teaching.html

В курсе рассматриваются различные задачи машинного обучения (machine learning), в том числе задачи классификации, кластеризации, регрессии и прогнозирования. Изучаются различные методы решения этих задач. 


Лучшее, что я видел на русском языке, и, может быть, лучший курс вообще.
</summary><link rel='replies' type='application/atom+xml' href='http://r-labs.blogspot.com/feeds/2943979950679058048/comments/default' title='Комментарии к сообщению'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment.g?blogID=130719118122223661&amp;postID=2943979950679058048' title='Комментарии: 0'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/2943979950679058048'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/2943979950679058048'/><link rel='alternate' type='text/html' href='http://r-labs.blogspot.com/2008/06/blog-post.html' title='Математические методы обучения по прецедентам'/><author><name>r_labs</name><uri>http://www.blogger.com/profile/02153101675637572811</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='16' height='16' src='http://img2.blogblog.com/img/b16-rounded.gif'/></author><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-130719118122223661.post-4066079547514312869</id><published>2008-05-26T13:07:00.011+04:00</published><updated>2008-07-22T14:36:07.304+04:00</updated><category scheme='http://www.blogger.com/atom/ns#' term='забавно'/><category scheme='http://www.blogger.com/atom/ns#' term='Vim'/><category scheme='http://www.blogger.com/atom/ns#' term='RCP'/><title type='text'>День девятый (Vim RCP)</title><summary type='text'>
ЗАДАЧА

Простенькое GUI приложение, позволяющее вручную определять кодировку текста.

РЕШЕНИЕ

Тексты встречаются в различных кодировках, в основном в KOI8-R и Cp1251. Для
текстов больших объёмов узнать какая именно из этих кодировок встретилась можно автоматически по соотношению заглавных и прописных букв. Оставшиеся "огрызки" от СAPS и Cp866 MODE фриков обрабатываются в Vim'е:

"run as:
"gvim </summary><link rel='replies' type='application/atom+xml' href='http://r-labs.blogspot.com/feeds/4066079547514312869/comments/default' title='Комментарии к сообщению'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment.g?blogID=130719118122223661&amp;postID=4066079547514312869' title='Комментарии: 0'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/4066079547514312869'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/4066079547514312869'/><link rel='alternate' type='text/html' href='http://r-labs.blogspot.com/2008/05/vim-rcp.html' title='День девятый (Vim RCP)'/><author><name>r_labs</name><uri>http://www.blogger.com/profile/02153101675637572811</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='16' height='16' src='http://img2.blogblog.com/img/b16-rounded.gif'/></author><media:thumbnail xmlns:media='http://search.yahoo.com/mrss/' url='http://bp2.blogger.com/_GRuOVxcYiO0/SDqDt5Q3niI/AAAAAAAAABE/VEoIieic_tw/s72-c/vimRCP.PNG' height='72' width='72'/><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-130719118122223661.post-3343283816315454393</id><published>2008-05-17T13:38:00.002+04:00</published><updated>2008-05-17T13:42:09.913+04:00</updated><category scheme='http://www.blogger.com/atom/ns#' term='the best'/><category scheme='http://www.blogger.com/atom/ns#' term='уважаю'/><title type='text'>Не могу молчать!</title><summary type='text'>
Уже месяц использую Assembla. Очень доволен.
Они - лучшие.
</summary><link rel='replies' type='application/atom+xml' href='http://r-labs.blogspot.com/feeds/3343283816315454393/comments/default' title='Комментарии к сообщению'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment.g?blogID=130719118122223661&amp;postID=3343283816315454393' title='Комментарии: 0'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/3343283816315454393'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/3343283816315454393'/><link rel='alternate' type='text/html' href='http://r-labs.blogspot.com/2008/05/blog-post_17.html' title='Не могу молчать!'/><author><name>r_labs</name><uri>http://www.blogger.com/profile/02153101675637572811</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='16' height='16' src='http://img2.blogblog.com/img/b16-rounded.gif'/></author><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-130719118122223661.post-4686454975041454952</id><published>2008-05-14T16:35:00.005+04:00</published><updated>2008-07-22T19:34:36.408+04:00</updated><category scheme='http://www.blogger.com/atom/ns#' term='memo'/><category scheme='http://www.blogger.com/atom/ns#' term='netflix contest'/><category scheme='http://www.blogger.com/atom/ns#' term='links'/><title type='text'>Две статьи</title><summary type='text'>
Две интересные статьи:
    Using String Kernels to Identify Famous Performers from their Playing Style       Robust De-anonymization of Large Datasets (How to Break Anonymity of the Netflix Prize Dataset) </summary><link rel='replies' type='application/atom+xml' href='http://r-labs.blogspot.com/feeds/4686454975041454952/comments/default' title='Комментарии к сообщению'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment.g?blogID=130719118122223661&amp;postID=4686454975041454952' title='Комментарии: 0'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/4686454975041454952'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/4686454975041454952'/><link rel='alternate' type='text/html' href='http://r-labs.blogspot.com/2008/05/blog-post.html' title='Две статьи'/><author><name>r_labs</name><uri>http://www.blogger.com/profile/02153101675637572811</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='16' height='16' src='http://img2.blogblog.com/img/b16-rounded.gif'/></author><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-130719118122223661.post-5706703411327259185</id><published>2008-03-04T00:00:00.010+03:00</published><updated>2008-07-26T20:19:50.983+04:00</updated><category scheme='http://www.blogger.com/atom/ns#' term='забавно'/><title type='text'>Разговор с психотерапевтом.</title><summary type='text'>Давеча из любопытства запустил Emacs, а там в меню психоаналитик "сидит" (как знать, может потомок Элизы). Далее два отрывка. В первом я попытался "исповедать" бота. Во втором - проверял его терпение. 

I am the psychotherapist. Please, describe your problems. Each time
you are finished talking, type RET twice.
I don't have any problems.

Why do you say you do not have any problems?
What do you </summary><link rel='replies' type='application/atom+xml' href='http://r-labs.blogspot.com/feeds/5706703411327259185/comments/default' title='Комментарии к сообщению'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment.g?blogID=130719118122223661&amp;postID=5706703411327259185' title='Комментарии: 0'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/5706703411327259185'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/5706703411327259185'/><link rel='alternate' type='text/html' href='http://r-labs.blogspot.com/2008/03/books.html' title='Разговор с психотерапевтом.'/><author><name>r_labs</name><uri>http://www.blogger.com/profile/02153101675637572811</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='16' height='16' src='http://img2.blogblog.com/img/b16-rounded.gif'/></author><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-130719118122223661.post-6366701823153240217</id><published>2008-02-23T15:29:00.015+03:00</published><updated>2008-07-26T20:18:32.088+04:00</updated><category scheme='http://www.blogger.com/atom/ns#' term='numbers'/><title type='text'>День восьмой (Неслучайные числа)</title><summary type='text'>
ЗАДАЧА
Мультипликативный датчик и плохие параметры.


РЕШЕНИЕ
Один из способов генерации псевдослучайных чисел - мультипликативный
датчик

rndvec &lt;- function(len, m, d) {
  k &lt;- 1
  vec &lt;- vector()
  for (i in 1:len) {
     k &lt;- (k * m) %% d
     vec[i] &lt;- k/d 
  }
  vec
}

при m == 2^16 + 3, d == 2^31 даёт
следующее распределение на кубе:

&gt; vs &lt;- rndvec(9999, 2^16 + 3, 2^31)
&gt; x &lt;- vs[vs %% 3 </summary><link rel='replies' type='application/atom+xml' href='http://r-labs.blogspot.com/feeds/6366701823153240217/comments/default' title='Комментарии к сообщению'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment.g?blogID=130719118122223661&amp;postID=6366701823153240217' title='Комментарии: 0'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/6366701823153240217'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/6366701823153240217'/><link rel='alternate' type='text/html' href='http://r-labs.blogspot.com/2008/02/pseudo-random.html' title='День восьмой (Неслучайные числа)'/><author><name>r_labs</name><uri>http://www.blogger.com/profile/02153101675637572811</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='16' height='16' src='http://img2.blogblog.com/img/b16-rounded.gif'/></author><media:thumbnail xmlns:media='http://search.yahoo.com/mrss/' url='http://bp2.blogger.com/_GRuOVxcYiO0/R8J75vYkTrI/AAAAAAAAAA0/r02q6twWRK4/s72-c/FSH.GIF' height='72' width='72'/><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-130719118122223661.post-4351334233634169819</id><published>2008-02-14T20:34:00.009+03:00</published><updated>2009-02-13T17:16:34.206+03:00</updated><category scheme='http://www.blogger.com/atom/ns#' term='programming'/><category scheme='http://www.blogger.com/atom/ns#' term='R as a language'/><title type='text'>День седьмой (Pipe operator)</title><summary type='text'>﻿
ЗАДАЧА

Поиск удобных способов организации кода. Реализация оператора |&gt;. Частичная аппликация.



РЕШЕНИЕ

Интересное наблюдение - в R аргументы передаются фактически в виде ассоциативного списка, а значит, можно было бы реализовать 'каррирование по ключу'. Что это значит?



&gt;# в псевдокоде:

&gt;paste_dot_sep &lt;- paste((collapse='.')) 

&gt;# Это тоже, что paste_dot_sep &lt;- function(x) paste(x, </summary><link rel='replies' type='application/atom+xml' href='http://r-labs.blogspot.com/feeds/4351334233634169819/comments/default' title='Комментарии к сообщению'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment.g?blogID=130719118122223661&amp;postID=4351334233634169819' title='Комментарии: 0'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/4351334233634169819'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/4351334233634169819'/><link rel='alternate' type='text/html' href='http://r-labs.blogspot.com/2008/02/pipe-operator.html' title='День седьмой (Pipe operator)'/><author><name>r_labs</name><uri>http://www.blogger.com/profile/02153101675637572811</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='16' height='16' src='http://img2.blogblog.com/img/b16-rounded.gif'/></author><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-130719118122223661.post-2638435791865856120</id><published>2008-02-08T14:09:00.001+03:00</published><updated>2008-07-22T11:12:24.797+04:00</updated><category scheme='http://www.blogger.com/atom/ns#' term='netflix contest'/><category scheme='http://www.blogger.com/atom/ns#' term='уважаю'/><category scheme='http://www.blogger.com/atom/ns#' term='links'/><title type='text'>О результатах Netflix contest</title><summary type='text'>
В декабрьском номере scgn за прошлый год была интересная статья о конкурсе на миллион от Netflix и промежуточных результатах.

В ней рассказывается о весьма драматической победе BellKor/KorBell. Впечатляет. После описания данных и условий конкурса идёт обзор различных стратегий для рекомендательных систем типа Collaborative Filtering и их комбинаций.

По ходу дела авторами было  разработано </summary><link rel='replies' type='application/atom+xml' href='http://r-labs.blogspot.com/feeds/2638435791865856120/comments/default' title='Комментарии к сообщению'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment.g?blogID=130719118122223661&amp;postID=2638435791865856120' title='Комментарии: 0'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/2638435791865856120'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/2638435791865856120'/><link rel='alternate' type='text/html' href='http://r-labs.blogspot.com/2008/02/netflix-contest.html' title='О результатах Netflix contest'/><author><name>r_labs</name><uri>http://www.blogger.com/profile/02153101675637572811</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='16' height='16' src='http://img2.blogblog.com/img/b16-rounded.gif'/></author><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-130719118122223661.post-7269432942342027647</id><published>2008-01-24T15:07:00.003+03:00</published><updated>2009-02-13T17:16:34.208+03:00</updated><category scheme='http://www.blogger.com/atom/ns#' term='projecteuler.net'/><category scheme='http://www.blogger.com/atom/ns#' term='numbers'/><category scheme='http://www.blogger.com/atom/ns#' term='R as a language'/><title type='text'>День шестой (projecteuler.net problem # 11)</title><summary type='text'>
ЗАДАЧА

Решить, например, http://projecteuler.net/index.php?section=problems&amp;id=11 


РЕШЕНИЕ

В решении вычисления размениваются на память:

  bttm &lt;- rep(0, 20)
  dat_ &lt;- rbind(dat.mtx, bttm, bttm, bttm)
  lft_rght &lt;- rep(0, 20 + 3)
  dat  &lt;- cbind(lft_rght, lft_rght, lft_rght, 
                dat_, lft_rght, lft_rght, lft_rght)

За счёт набивки лишними нулями код упростится.
Важное замечание</summary><link rel='replies' type='application/atom+xml' href='http://r-labs.blogspot.com/feeds/7269432942342027647/comments/default' title='Комментарии к сообщению'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment.g?blogID=130719118122223661&amp;postID=7269432942342027647' title='Комментарии: 0'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/7269432942342027647'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/7269432942342027647'/><link rel='alternate' type='text/html' href='http://r-labs.blogspot.com/2008/01/projecteulernet-problem-11.html' title='День шестой (projecteuler.net problem # 11)'/><author><name>r_labs</name><uri>http://www.blogger.com/profile/02153101675637572811</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='16' height='16' src='http://img2.blogblog.com/img/b16-rounded.gif'/></author><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-130719118122223661.post-5622901569673134615</id><published>2008-01-21T20:13:00.003+03:00</published><updated>2008-08-14T21:40:52.480+04:00</updated><category scheme='http://www.blogger.com/atom/ns#' term='comments'/><category scheme='http://www.blogger.com/atom/ns#' term='уважаю'/><category scheme='http://www.blogger.com/atom/ns#' term='books'/><title type='text'>Наглядная математическая статистика. Отличная книга!</title><summary type='text'>

Купил её недавно в магазине по цене раза в два большей чем в том же www.books.ru, но нисколечки не жалею. Сейчас понимаю, что отдал бы и троекратную сумму. Очень хорошая работа, давно не держал на руках такую книгу, с удовольствием читаю. Это учебник только по статистике и анализу данных. Необходимый минимум материала по теории вероятностей вынесен в приложения. Книга очень напоминает "</summary><link rel='replies' type='application/atom+xml' href='http://r-labs.blogspot.com/feeds/5622901569673134615/comments/default' title='Комментарии к сообщению'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment.g?blogID=130719118122223661&amp;postID=5622901569673134615' title='Комментарии: 0'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/5622901569673134615'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/5622901569673134615'/><link rel='alternate' type='text/html' href='http://r-labs.blogspot.com/2008/01/comments.html' title='Наглядная математическая статистика. Отличная книга!'/><author><name>r_labs</name><uri>http://www.blogger.com/profile/02153101675637572811</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='16' height='16' src='http://img2.blogblog.com/img/b16-rounded.gif'/></author><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-130719118122223661.post-9146192466596744598</id><published>2008-01-19T17:51:00.000+03:00</published><updated>2008-01-19T18:09:01.217+03:00</updated><category scheme='http://www.blogger.com/atom/ns#' term='comments'/><title type='text'>Мимоходом</title><summary type='text'> 
На лабораторные нет ни времени, ни идей. Я конечно что - то делаю, но так, по мелочи - ничего интересного не получается. Поигрался с картами Кохонена (пакет RWeka не потребовался) - результаты ожидаемые. Осваивал карты на выборных данных - ничего необычного, 3 кластера (нет, не левые - центр - правые, а то, что я назвал бы: протестные, едро, лузиры ). Любопытно, правда как прошла кластеризация </summary><link rel='replies' type='application/atom+xml' href='http://r-labs.blogspot.com/feeds/9146192466596744598/comments/default' title='Комментарии к сообщению'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment.g?blogID=130719118122223661&amp;postID=9146192466596744598' title='Комментарии: 0'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/9146192466596744598'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/9146192466596744598'/><link rel='alternate' type='text/html' href='http://r-labs.blogspot.com/2008/01/blog-post_19.html' title='Мимоходом'/><author><name>r_labs</name><uri>http://www.blogger.com/profile/02153101675637572811</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='16' height='16' src='http://img2.blogblog.com/img/b16-rounded.gif'/></author><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-130719118122223661.post-647977166373984640</id><published>2008-01-04T21:51:00.000+03:00</published><updated>2008-01-04T22:01:34.321+03:00</updated><category scheme='http://www.blogger.com/atom/ns#' term='comments'/><title type='text'>Красивости</title><summary type='text'>
Сегодня с искренним удивлением обнаружил, что IE  не совем корректно
отображает записи и форматирует код. Кроме того, захотелось подсветки синтаксиса.
Подсветку нашёл на прогрессивном и идеологически дружественном  блоге sunday-lab. И с форматированием повозился. Что теперь будет под файрфоксом боюсь представить.
</summary><link rel='replies' type='application/atom+xml' href='http://r-labs.blogspot.com/feeds/647977166373984640/comments/default' title='Комментарии к сообщению'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment.g?blogID=130719118122223661&amp;postID=647977166373984640' title='Комментарии: 0'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/647977166373984640'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/647977166373984640'/><link rel='alternate' type='text/html' href='http://r-labs.blogspot.com/2008/01/blog-post.html' title='Красивости'/><author><name>r_labs</name><uri>http://www.blogger.com/profile/02153101675637572811</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='16' height='16' src='http://img2.blogblog.com/img/b16-rounded.gif'/></author><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-130719118122223661.post-9020510974679419276</id><published>2007-12-25T19:30:00.001+03:00</published><updated>2008-07-23T16:19:51.989+04:00</updated><category scheme='http://www.blogger.com/atom/ns#' term='packages'/><category scheme='http://www.blogger.com/atom/ns#' term='comments'/><category scheme='http://www.blogger.com/atom/ns#' term='som'/><category scheme='http://www.blogger.com/atom/ns#' term='уважаю'/><category scheme='http://www.blogger.com/atom/ns#' term='scans (пиратчина)'/><category scheme='http://www.blogger.com/atom/ns#' term='links'/><title type='text'>Мимоходом</title><summary type='text'>
Почитал отрывки из книги о применении СОК в анализе финансовых данных. Понравилась четырнадцатая глава с конкретными рецептами - советами. Первая глава
 даёт хорошее представление о том, что есть СОК. Оцифровка любительская.

Уважаю авторов сайта http://www.omegahat.org и пакетов, выложенных на нём. В основном там разнообразные привязки, как, например, Rlibstree к http://www.icir.org/christian/</summary><link rel='replies' type='application/atom+xml' href='http://r-labs.blogspot.com/feeds/9020510974679419276/comments/default' title='Комментарии к сообщению'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment.g?blogID=130719118122223661&amp;postID=9020510974679419276' title='Комментарии: 0'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/9020510974679419276'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/9020510974679419276'/><link rel='alternate' type='text/html' href='http://r-labs.blogspot.com/2007/12/blog-post.html' title='Мимоходом'/><author><name>r_labs</name><uri>http://www.blogger.com/profile/02153101675637572811</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='16' height='16' src='http://img2.blogblog.com/img/b16-rounded.gif'/></author><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-130719118122223661.post-4606511881331219875</id><published>2007-12-19T14:45:00.001+03:00</published><updated>2008-02-23T15:50:42.226+03:00</updated><category scheme='http://www.blogger.com/atom/ns#' term='packages'/><category scheme='http://www.blogger.com/atom/ns#' term='XML'/><category scheme='http://www.blogger.com/atom/ns#' term='programming'/><title type='text'>День пятый (пакет XML)</title><summary type='text'>
ЗАДАЧА
Выполнить синтаксический анализ HTML документа, выяснить возможности выполнения XPath запросов.

РЕШЕНИЕ
Некоторое время я потратил на "ложный след" - решил проводить вычистку (xml-изацию) документа с помощью JTidy. В связи с чем поставил rJava. К сожалению, это пакет не очень продуман в плане удобства пользования - пользователь обязывается использовать соглашения JNI для именования типов</summary><link rel='replies' type='application/atom+xml' href='http://r-labs.blogspot.com/feeds/4606511881331219875/comments/default' title='Комментарии к сообщению'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment.g?blogID=130719118122223661&amp;postID=4606511881331219875' title='Комментарии: 0'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/4606511881331219875'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/4606511881331219875'/><link rel='alternate' type='text/html' href='http://r-labs.blogspot.com/2007/12/xml.html' title='День пятый (пакет XML)'/><author><name>r_labs</name><uri>http://www.blogger.com/profile/02153101675637572811</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='16' height='16' src='http://img2.blogblog.com/img/b16-rounded.gif'/></author><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-130719118122223661.post-2021469766484791793</id><published>2007-12-06T12:47:00.001+03:00</published><updated>2008-07-22T19:34:36.409+04:00</updated><category scheme='http://www.blogger.com/atom/ns#' term='memo'/><category scheme='http://www.blogger.com/atom/ns#' term='jquery'/><category scheme='http://www.blogger.com/atom/ns#' term='programming'/><category scheme='http://www.blogger.com/atom/ns#' term='web harvesting'/><title type='text'>День четвёртый (web harvesting)</title><summary type='text'>
ЗАДАЧА
Для работы с данными из веба надо сначало извлечь их. Затем сконвертировать в объекты, понимаемые R. Поскольку содержание страниц может меняться, надо как - то автоматизировать сбор данных, по  возможности сделав его устойчивым к изменению страницы или, по крайней мере, легко модифицируемым.

РЕШЕНИЕ
Полностью автоматизировать сбор, основываясь, например, на регулярности элементов DOM не </summary><link rel='replies' type='application/atom+xml' href='http://r-labs.blogspot.com/feeds/2021469766484791793/comments/default' title='Комментарии к сообщению'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment.g?blogID=130719118122223661&amp;postID=2021469766484791793' title='Комментарии: 0'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/2021469766484791793'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/2021469766484791793'/><link rel='alternate' type='text/html' href='http://r-labs.blogspot.com/2007/12/web-harvesting.html' title='День четвёртый (web harvesting)'/><author><name>r_labs</name><uri>http://www.blogger.com/profile/02153101675637572811</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='16' height='16' src='http://img2.blogblog.com/img/b16-rounded.gif'/></author><media:thumbnail xmlns:media='http://search.yahoo.com/mrss/' url='http://bp1.blogger.com/_GRuOVxcYiO0/R1fdYeevwuI/AAAAAAAAAAU/h1G3Az9203I/s72-c/Screenshot.png' height='72' width='72'/><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-130719118122223661.post-6672977471865438168</id><published>2007-11-02T20:45:00.000+03:00</published><updated>2008-07-23T16:19:51.994+04:00</updated><category scheme='http://www.blogger.com/atom/ns#' term='comments'/><category scheme='http://www.blogger.com/atom/ns#' term='scans (пиратчина)'/><category scheme='http://www.blogger.com/atom/ns#' term='intro'/><title type='text'>А мне книгу дали</title><summary type='text'>
Читать времени нет, но отдавать пора.
Я отсканировал из неё интересные места.
Книга называется что - то вроде:
"Анализ финансовых данных и самоорганизующиеся карты Кохонена."
Прикладной направленности книга.
Но к моим данным, как можно применять SOM, пока не вижу.
Хотя для первичного анализа очень симпатично смотрятся картинки, да.
Выложу сканы с соответствующей меткой.

Забавно - в процессе </summary><link rel='replies' type='application/atom+xml' href='http://r-labs.blogspot.com/feeds/6672977471865438168/comments/default' title='Комментарии к сообщению'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment.g?blogID=130719118122223661&amp;postID=6672977471865438168' title='Комментарии: 0'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/6672977471865438168'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/6672977471865438168'/><link rel='alternate' type='text/html' href='http://r-labs.blogspot.com/2007/11/blog-post.html' title='А мне книгу дали'/><author><name>r_labs</name><uri>http://www.blogger.com/profile/02153101675637572811</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='16' height='16' src='http://img2.blogblog.com/img/b16-rounded.gif'/></author><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-130719118122223661.post-637792392347912597</id><published>2007-10-22T13:49:00.000+04:00</published><updated>2009-02-13T17:16:34.210+03:00</updated><category scheme='http://www.blogger.com/atom/ns#' term='R as a language'/><category scheme='http://www.blogger.com/atom/ns#' term='lazy evaluation'/><category scheme='http://www.blogger.com/atom/ns#' term='tail recursion'/><title type='text'>День третий (an investigation)</title><summary type='text'>
TASK
An Investigation. R and tail recursion. Lazy evaluation in R.
 
SOLUTION
With a Google's help i found this message:

http://finzi.psych.upenn.edu/R/Rhelp02a/archive/73651.html

&gt; Some functional languages have a feature called tail recursion that  
&gt; can provide performance improvements if you write your recursions  
&gt; to take advantage of it:  
&gt;  
&gt; http://en.wikipedia.org/wiki/</summary><link rel='replies' type='application/atom+xml' href='http://r-labs.blogspot.com/feeds/637792392347912597/comments/default' title='Комментарии к сообщению'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment.g?blogID=130719118122223661&amp;postID=637792392347912597' title='Комментарии: 0'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/637792392347912597'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/637792392347912597'/><link rel='alternate' type='text/html' href='http://r-labs.blogspot.com/2007/10/task-investigation.html' title='День третий (an investigation)'/><author><name>r_labs</name><uri>http://www.blogger.com/profile/02153101675637572811</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='16' height='16' src='http://img2.blogblog.com/img/b16-rounded.gif'/></author><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-130719118122223661.post-2143222754176337141</id><published>2007-10-20T11:45:00.000+04:00</published><updated>2009-02-13T17:16:34.211+03:00</updated><category scheme='http://www.blogger.com/atom/ns#' term='lazy list'/><category scheme='http://www.blogger.com/atom/ns#' term='R as a language'/><category scheme='http://www.blogger.com/atom/ns#' term='lazy evaluation'/><title type='text'>День второй (lazy list)</title><summary type='text'>
ЗАДАЧА
Реализация ленивых списков и ленивых вычислений над ними.

РЕШЕНИЕ
Первоначально я сконструировал список так:

&gt; nums_from &lt;-function(n)
     c(function() n, 
       function() 
          c(function() n + 1, 
            function() nums_from(n + 2)))

Сразу же выяснил, что писать функции, работающие с ним не очень удобно:

&gt; ints &lt;- nums_from(1) 
&gt; ints[[1]]()
[1] 1
&gt; ints[[2]]()[[1]]()
[</summary><link rel='replies' type='application/atom+xml' href='http://r-labs.blogspot.com/feeds/2143222754176337141/comments/default' title='Комментарии к сообщению'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment.g?blogID=130719118122223661&amp;postID=2143222754176337141' title='Комментарии: 0'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/2143222754176337141'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/2143222754176337141'/><link rel='alternate' type='text/html' href='http://r-labs.blogspot.com/2007/10/blog-post_20.html' title='День второй (lazy list)'/><author><name>r_labs</name><uri>http://www.blogger.com/profile/02153101675637572811</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='16' height='16' src='http://img2.blogblog.com/img/b16-rounded.gif'/></author><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-130719118122223661.post-3467410191343199645</id><published>2007-10-17T23:59:00.001+04:00</published><updated>2009-02-13T17:16:34.213+03:00</updated><category scheme='http://www.blogger.com/atom/ns#' term='numbers'/><category scheme='http://www.blogger.com/atom/ns#' term='R as a language'/><title type='text'>День первый (an arithmetic)</title><summary type='text'>
ЗАДАЧА
При некотором натуральном n числа 4n+5 и 9n+4 - точные квадраты. Доказать, что число 5n+4 делится на 29.

РЕШЕНИЕ
В действительности - это задача на вычеты, и не важно даже - точные квадраты первые два числа или нет. И вот почему:

9n + 4 - (4n + 5) = 5n - 1, 5n + 4 = 0 mod 29 
&lt;=&gt; 5n - 1 = 24 mod 29
Используя R проверим:

&gt; ns &lt;- 1:29 # а дальше повторы 
&gt; ns[1] 1 2 3 4 5 6 7 8 9 10 11 </summary><link rel='replies' type='application/atom+xml' href='http://r-labs.blogspot.com/feeds/3467410191343199645/comments/default' title='Комментарии к сообщению'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment.g?blogID=130719118122223661&amp;postID=3467410191343199645' title='Комментарии: 0'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/3467410191343199645'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/3467410191343199645'/><link rel='alternate' type='text/html' href='http://r-labs.blogspot.com/2007/10/blog-post_17.html' title='День первый (an arithmetic)'/><author><name>r_labs</name><uri>http://www.blogger.com/profile/02153101675637572811</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='16' height='16' src='http://img2.blogblog.com/img/b16-rounded.gif'/></author><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-130719118122223661.post-7476280453954497519</id><published>2007-10-14T21:19:00.000+04:00</published><updated>2008-01-04T21:12:03.709+03:00</updated><category scheme='http://www.blogger.com/atom/ns#' term='comments'/><category scheme='http://www.blogger.com/atom/ns#' term='intro'/><title type='text'>Запись вводная</title><summary type='text'>Основные темы этих лабораторных записей: анализ данныхпрограммирование на языке R (и не только)R, как программаЗа образец взяты записки inferno программиста. Мотивы те же.

Формат записей следующий:

Задача - тема лабораторной
Решение - решение, как я его вижу на текущий момент
Вывод - оставлю как отдушину для графоманства )</summary><link rel='replies' type='application/atom+xml' href='http://r-labs.blogspot.com/feeds/7476280453954497519/comments/default' title='Комментарии к сообщению'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment.g?blogID=130719118122223661&amp;postID=7476280453954497519' title='Комментарии: 0'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/7476280453954497519'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/130719118122223661/posts/default/7476280453954497519'/><link rel='alternate' type='text/html' href='http://r-labs.blogspot.com/2007/10/blog-post.html' title='Запись вводная'/><author><name>r_labs</name><uri>http://www.blogger.com/profile/02153101675637572811</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='16' height='16' src='http://img2.blogblog.com/img/b16-rounded.gif'/></author><thr:total>0</thr:total></entry></feed>
