Компьютерные системы

Автор работы: Пользователь скрыл имя, 31 Января 2013 в 00:00, контрольная работа

Краткое описание

Ответы на вопросы:
Что такое многоядерность?
Что такое векторизация?
Основные особенности несимметричных мультипроцессорных систем.
Проблема миграции.
Структуры мультипроцессорных систем с современными процессорами Оpteron.
Требования, которые предъявляются к кластерам високой готовности.

Вложенные файлы: 1 файл

Компьютерные системы.doc

— 534.00 Кб (Скачать файл)

      Поэтому NUMA-МВС вряд ли могут заменить симметричные МВС при решении задач, требующих частой синхронизации. Ситуация улучшается, если удается разделить приложение на части, каждая из которых располагается в одном узле и взаимодействия между которыми возникают не слишком часто. Например, NUMA-МВС с двумя узлами можно эффективно использовать для ведения бухгалтерии корпорации, имеющей два относительно независимых офиса. Эффективно использовать NUMA-МВС могут СУБД, оптимизаторы которых в состоянии разбить сложный запрос на независимо выполняемые части (например, сканирующие разные части большой таблицы).

       В современных несимметричных МВС связи между процессорами и удаленными оперативными памятями реализуют либо через прямые связи (например, как это реализовано в МВС на базе процессоров Opteron), либо с помощью неблокирующихся коммутаторов (например, как в МВС на базе процессоров Power 4, Power 5, либо в МВС Superdome 2  на базе процессоров Itanium 2).

 

24. Проблема миграции:

       В традиционной  симметричной МВС по умолчанию одна из задач планировщика заключается в том, чтобы запустить следующий разрешенный для выполнения процесс (или нить) на первом же процессоре, который становится свободным. Поэтому по мере того, как увеличивается число процессоров и процессов (нитей), вероятность перемещения процессов (нитей) с одного процессора на другой, также увеличивается. При возобновлении процесса (нити) на новом процессоре должен быть очищен кэш этого процессора. Продолжение процесса (нити) начнется при пустом кэше (эквивалентно «холодному» старту при первом запуске процесса или нити). Вследствие этого увеличится время выполнения процесса. При достаточно частых остановах и возобновлениях процесса (нити) потери времени могут быть значительными. В несимметричных МВС эти потери будут еще большими, так как код и данные процесса (нити) после очередного переноса будут находиться не в локальной оперативной памяти процессора, а в удаленной оперативной памяти. Очевидно, что миграция процессов может приводить к снижению производительности, особенно несимметричных МВС.

       Одним из  вариантов снижения вредного влияния миграции является связывание процесса (нити) с процессором.  Принадлежностью процесса  (нити) процессору называется свойство, гарантирующее, что работа процесса (нити) всегда возобновляется на том же процессоре, на котором она выполнялась раньше независимо от загруженности других процессоров системы. Ценность этого свойства прямо пропорциональна объему данных нити, хранящихся в кэше, количеству обращений в локальную оперативную память в случае несимметричной МВС и обратно пропорциональна времени простоя процесса (нити). Планировщики современных  операционных  систем (в частности Windows 2003 Server и последующие версии) применяют   это свойство для тех процессов (нитей), для которых это задается при первоначальном запуске процесса (нити). 

          Связывание может эффективно  применяться в программах с  большой нагрузкой на процессор  и небольшим числом прерываний. Однако иногда связывание может  послужить причиной снижения  производительности, так как процессу (нити) придется ждать освобождения процессора после выполнения операции ввода-вывода. Если процесс (нить) была заблокирована на время выполнения операции ввода-вывода, то маловероятно, что информация о ней сохранилась в кэше процессора. В этом случае продолжение работы процесса (нити) на другом процессоре было бы эффективнее.

36. Структуры  мультипроцессорных  систем с современными  процессорами Оpteron:

Эволюция серверных  процессоров  фирмы AMD  показана  на рис. 2.

Рис. 2 - Эволюция серверных процессоров фирмы AMD 

Основные  особенности процессоров  линии  Opteron - Barcelona,   Shanghai, Istanbul, Magny-Cours:

Barcelona - первый процессор,  реализованный с истинно  четырёхъядерной структурой,  когда все четыре ядра реализованы в одном кристалле. Упрощенная структура четырехядерного процессора Barcelona  приведена на рис. 3.

Основные особенности:

  • реализован с использованием 65 нм технологического процесса; 
  • имел - интегрированный двухканальный контроллер оперативной памяти стандарта DDR2;
  • до трех контроллеров Hyper Transport;
  • 64 Кбайт кэша данных и 64 Кбайт кэша инструкций L1 для каждого ядра, 512 Кбайт кэша L2 на каждое ядро;
  • общий распределённый кэш L3 – 2 Мбайт   на 4 ядра. 

 

 

Рис. 3. - Упрощенная структура четырехядерного процессора Barcelona

 

Процессоры Shanghai - дальнейшим развитием процессоров линии Opteron  были четырехядерные процессоры   Shanghai. Структура этих процессоров аналогична структуре процессоров Barcelona.

 Основные отличия:

- реализован с использованием 45 нм технологического процесса;

- увеличенный кэш L3 до  6 Мбайт.

Процессор Istanbul - это 6-ти ядерный процессор, реализованный в одном кристалле. Все другие параметры такие же как и у процессора Shanghai.

Реализованная  в процессоре технология HT Assist, обеспечивает (рис. 4)  оптимизацию потоков данных между процессорными ядрами. Механизм действия технологии выглядит следующим образом. Когда одному кристаллу многопроцессорной системы необходимо обработать определенный массив данных, то сначала проводится процедура проверки, не присутствует ли необходимая информация в кэш-памяти ядер соседних процессоров. Если дан отрицательный ответ, то осуществляется чтение данных из оперативной памяти. В случае МВС, оснащенной сразу четырьмя процессорами, для проведения подобной проверки может потребоваться до десяти транзакций. Технология HT Assist как раз и призвана снизить их количество до минимума - каждый из процессоров теперь "знает", куда необходимо обратиться за порцией необходимых данных, и максимальное число транзакций снижается до двух. Разумеется, приходится занимать определенный объем кэш-памяти под хранение сервисной информации - в случае HT Assist для этого выделяется 1 Мб кэш-памяти третьего уровня для каждого из процессоров. Но повышение производительности системы вполне оправдывает затраченные средства.

 

 

Рис. 4 - Преимущества технологии HT Assist.

 

Примеры  структур несимметричных МВС с процессорами линии Opteron Barcelona,    Shanghai, Istambul

Процессоры линии Opteron Barcelona,   Shanghai,  Istambul с тройным интерфейсом HyperTransport позволяют создавать несимметричные  4-х и 8-ми сокетные вычислительные системы. Пример четырехсокетной вычислительной системы с процессорами Barcelona приведен на рис. 5,  а 8-ми сокетной  – на рис. 6.

 

Рис. 5. – 4-х сокетная (16-ти ядерная) вычислительная система на базе процессоров Barcelona

Рис. 6. -  Структура 8-ми сокетной вычислительной системы

46.   Требования, которые предъявляются к кластерам  високой готовности :

Обобщенная структура  кластера высокой производительности (на примере структуры кластера МВС 1000М) приведена на рис. 7.

 

 

Рис. 7. – Обобщенная структура кластера высокой производительности МВС 1000М

 

В кластерах  высокой производительности обязательно  присутствует управляющая вычислительная система (на рис 7. это управляющий узел), в качестве которой, как правило,  используется мультипроцессорная вычислительная система со специализированной операционной системой. Возможно включение в конфигурацию управляющей вычислительной системы специализированных вычислительных систем, например, файл-сервера, сервера визуализации.  Как правило, предоставлена возможность удаленного доступа на кластер через Internet.

Управляющая вычислительная система создает для пользователя так называемый единый образ вычислительной системы, т.е. для пользователя кластер — это большая вычислительная система (единый ресурс), в  которой выполняется  множество приложений, хотя в действительности они могут  выполняться  только на части узлов.

Управляющая вычислительная система принимает задания от пользователей, планирует их выполнение  на вычислительных узлах, обеспечивает ввод-вывод данных. Для этих целей в ее составе, как правило, имеются необходимые подсистемы. Она соединяется с вычислительными узлами специальными сетями (Gigabit Ethernet и Fast  Ethernet в приведенном на рис. 7 примере).

Каждый вычислительный узел – это полноценная вычислительная система с необходимым набором  средств и со своей копией операционной системы. Состав и мощность вычислительных узлов могут быть разными в рамках одного кластера, однако чаще строятся однородные кластеры.

Вычислительные  узлы в кластере соединяются:

между собой - высокопроизводительной коммуникационной сетью первого  ранга для максимально быстрого обмена данными при выполнении различных потоков одного процесса;

с управляющей  вычислительной системой:

коммуникационной  сетью второго ранга. Ее производительность, как правило, в несколько раз  меньше производительности коммуникационной сети первого ранга;

коммуникационной сетью третьего  ранга (диагностической сетью). Производительность этой сети может быть значительно меньше производительности  сети второго ранга.

Выбор конкретной коммуникационной среды каждого  ранга определяется многими факторами: особенностями класса решаемых задач, доступным финансированием, необходимостью последующего расширения кластера и т.п.

Кластер высокой производительности — это сложный программно-аппаратный комплекс, и задача построения кластера не ограничивается объединением большого количества узлов в один сегмент. Для того чтобы кластер высокой производительности быстро и правильно выполнял  задачу, все комплектующие должны быть тщательно подобраны друг к другу с учетом требований программного обеспечения, так как производительность кластерного программного обеспечения  сильно зависит от структуры кластера, характеристик входящих в состав узлов процессоров, коммуникационной подсистемы между процессорами и оперативной  памятью,   от производительности  сети, соединяющей вычислительные узлы.

Использование тех или иных компонентов сильно зависит от задачи, для которой строится кластер высокой производительности. Для некоторых хорошо распараллеливаемых задач (таких, как рендеринг независимых сюжетов в видеофрагменте) основной фактор быстродействия — мощные процессоры, а производительность сети не играет основной роли. В то же время для задач гидро- и аэродинамики, расчета крэш-тестов и ряда других важна производительность системной сети, иначе увеличение числа вычислительных узлов в кластере  высокой производительности будет мало влиять на скорость решения задачи.

 

57.    Свойства простейшего потока заявок:     

       Совокупность событий, распределенных во времени, называется потоком заявок. Различают входящие (поступают в систему) и выходящие (покидают систему) потоки заявок. Поток заявок рассматривается как случайный  процесс,  задаваемый  функцией распределения промежутков времени между поступлениями двух соседних заявок. Интенсивность потока заявок равна среднему числу заявок, поступающих в единицу времени.    Величина, обратная интенсивности, определяет средний интервал времени между двумя последовательными заявками, . Различают стационарные и нестационарные потоки заявок. Стационарным называется поток, характеристики которого не меняются во времени. Нестационарный поток обладает тем свойством, что его характеристики меняются во времени. Характеристики компьютерных систем определяются наиболее просто для стационарного режима функционирования системы, предполагающего стационарность потоков заявок. По этой причине при анализе компьютерных систем нестационарные потоки апроксимируются на отдельных отрезках времени стационарными потоками. В теории массового обслуживания наибольшее число аналитических результатов получено для простейших потоков.

Простейший  поток обладает следующими свойствами:

  • - стационарностью – вероятностные характеристики потока не меняются во времени;
  • - отсутствием последействия (заявки поступают в систему независимо друг от друга, в частности, длина интервала времени до момента поступления следующей заявки не зависит от того, поступила в начальный момент заявка или нет);
  • - ординарностью – в каждый момент времени в систему может поступать не более одной заявки.

       Для простейшего потока интервалы времени между двумя последовательными заявками – независимые случайные величины с функцией распределения      . Распределение такого вида, называется  показательным или экспоненциальным и имеет плотность распределения вероятности       .

Простейший  поток  обладает следующими свойствами:

а) сумма независимых ординарных потоков с интенсивностями

( =1 ….M) сходится к простейшему потоку с интенсивностью

,

при условии, что складываются потоки, оказывающие приблизительно одинаково малое влияние на суммарный  поток. Сходимость суммарных потоков  к простейшему происходит очень  быстро. Практически, можно считать, что сложение четырех-пяти  стационарных,  ординарных независимых потоков, сравнимых по интенсивности, достаточно для того, чтобы суммарный поток был близок к простейшему. Для выяснения всех свойств суммарного потока достаточно знать лишь интенсивности суммируемых потоков и, практически, не требуется знать внутреннюю структуру этих потоков;

б)  простейший поток обладает устойчивостью, которая состоит в том, что при суммировании независимых простейших потоков получается снова простейший поток, причем интенсивности складываемых потоков суммируется;

в) поток заявок, полученный путем случайного разрежения исходного потока, когда каждая заявка с определенной вероятностью p исключается из потока, независимо от того, исключены другие заявки или нет, образует простейший поток с интенсивностью    ,  где - интенсивность входного потока. Это свойство определяет широкое использование простейших потоков при исследовании компьютерных систем. В отношении исходного потока заявок при этом   делается лишь предположение об ординарности и стационарности.

       Для простейшего потока заявок характерно, что поступление заявок через короткие промежутки времени более вероятно, чем через длительные. Таким образом, по сравнению с другими потоками, простейший поток создает наиболее тяжелый режим работы системы. Поэтому предположение о том,  что на вход системы поступает простейший поток заявок, приводит к определению предельных значений характеристик качества обслуживания заявок системой. Если реальный поток отличен от простейшего, то система будет функционировать не хуже, чем это следует из полученных оценок.

Информация о работе Компьютерные системы