Rosetta@Home Faq


Чем занимается Rosetta@Home?

Цель проекта - решение одной из главных задач молекулярной биологии - вычисление 3-х мерной структуры белков по их аминокислотных последовательностей. Исследования по данному проекту помогут в проектировании новых, не существующих белков. В случае успеха мы получим новые возможности в борьбе с такими болезнями как рак, малярия, болезнь Альцгеймера, сибирская язва и другими генетическими и вирусными заболеваниями.

Каковы системные требования Rosetta@Home?

Rosetta@Home базируется на платформе BOINС и работает практически везде, где можно запустить BOINC. Поддерживаемые операционные системы:
Windows - Windows 98/ME/2000/XP/Vista/7
Macintosh - Mac OS X 10.3.9, или выше
Linux (32-bit/64-bit) - Red Hat Linux 8.X, 9.X; Mandrake Linux 10.x; Fedora Core 7, 8, and 9; Debian 4.1; Ubuntu 7.10, 8.04, 8.10, 9.04; Mandriva, Sabayon, Mint, Gentoo

Официальные системные требования не слишком строги. Минимум - это процессор с тактовой частотой 500 MHz. Кроме процессора нужно немного места на жестком диске и иметь доступ в интернет (хотя бы на короткое время), чтобы закачивать задания и отправлять результаты. Rosetta@Home занимает сравнитльно немало места в оперативной памяти: от 200 Мб на задание. Дедлайн (срок, когда задание перестает быть актуальным) имеется, но достаточно либерален, и даже при умеренном счете о нем вряд ли придется задумываться.

Как обстоят дела с трафиком?

Трафик - одна из крупных проблем проекта. При первом подключении вам необходимо скачать сам boinc клиент размером около 10 Мб и файлы Розетты размером около 20 Мб. Кроме этого надо закачивать задания. И с ними трафик может достигать 20Мб в день на мощной машине. Для того, чтобы сократить трафик надо пройти по этой ссылке и в поле Target CPU run time поставить 1 days. После этого считать Розетту можно будет, даже если у вас диал-ап. Задание, размером около 5Мб будет считаться сутки и за это время трафик тратиться не будет. Результат, загружаемый на сервер имеет размер примерно 3-8 мегабайт.
Ведутся работы над дальнейшим снижением трафика, но пока что-то не видно.

Еще я слышал про какую-то избыточность?

Избыточность в Розетте равна 1. Обычно избыточность боинк-проектов равна 4, то есть одно задание выдается четверым участникам, чтобы разработчики имели возможность сверять результаты. Алгогритмы розетты основаны на вероятностном подходе и позволяют обойтись без традиционной сверки результатов. Алгоритмы кроме точных начальных данных используют псевднослучайные параметры, поэтому двух индентичных результатов не бывает и сверять нечего. При таком подходе это и не нужно. Каждый белок (или пару белков, если моделируется взаимодействие) считают очень много, от десятков до сотен тысяч раз (каждый такой единичный расчет называют моделью или decoys в оригинале). Потом, собрав все эти decoys вместе, их данные обрабатывают с помощью статистического анализа, по его результатам при необходимости вносят какие-то коррективы и запускают следующую пачку заданий. В одной жабе (задании - сленг.) может быть от одного до нескольких сотен decoys (в зависимости от сложности модели, мощности процессора, времени счета), так что один белок (пару белков) считает множество людей, а единичные неадекватные результаты отбрасываются при статистической обработке результатов.

Как считаются очки/кредиты?

С кредитами разберемся по пунктам:

1. Claimed credit = (whetstone + dhrystone)*Tвычислений/1728000.
Где:
whetstone - скорость вычислений с плавающей точкой (FLOPS/s). (Например - 1785 миллионов/сек).
dhrystone - скорость вычислений с целыми числами (например - 3075 миллионов/сек).
Tвычислений - измеряется в секундах.
2. Теперь давайте разберёмся, откуда взялся коэффициент 1728000:
Как уже говорилось выше, объём вычислений V0 можно записать как: V0 = (Whetstone + Dhrystone)*T
В тоже время, согласно определению:
1 Cobblestone = (1GFLOPS/s + 1GINTOPS/s) *24 часа * 3600 секунд /100 = 2 GigaOPS/s * 24 * 3600 / 100 = 1728 GigaOPS/s
Тогда, выражая объём вычислений в Cobblestones мы получим:
V = V0/(1 Cobblestone) = (Whetstone + Dhrystone)*T/1728GigaOPS/s.
Поскольку результаты бенчмарков принято записывать в миллионах операций в секунду, то приставку Giga мы заменяет на 1000, а миллионы операций в секунду просто отбрасываем - поскольку они сокращаются и сверху (Whetstone + Dhrystone) и снизу (GigaOPS/s = 1000 MegaOPS/s).
3. Как считается Recent Average Credit (RAC), написано тут http://boinc.berkeley.edu/credit.php. Примерно он соответствует среднему значению очков/день за последний месяц.

Я хочу присоединиться. Как это сделать?

Краткая последовательность действий такова:
1. Вы скачиваете и устанавливаете на свой компьютер программу BOINС. Взять последнюю версию BOINC для вашей операционной системы можно тут - http://boinc.berkeley.edu/download.php
2. В настройках вы выбирате среди проектов Rosetta@Home.
3. Вам предлагают зарегистрироваться в проекте, для этого потребуется ввести почту и пароль.
4. Вы выбираете команду, за которую хотите считать. Мы называемся TSC! Russia. 5. Все! Программа проведет тест производительности вашего компьютера и вам скачаются первые задания. Если вы не изменяли время счета, примерно через 3 часа будет получен первый результат. Обновление статистики может занять чуть дольше.