Аннотация – Размер и количество центров обработки данных быстро растут во всем мире, и их растущее общее энергопотребление вызывает озабоченность во всем мире. Более того, увеличение количества вариаций процессов в нанометровых технологиях и их влияние на общее энергопотребление серверов сделало неизбежным переход к стратегиям снижения потребления с учетом изменений.
Повышение стоимости энергопотребления оборудования для информационно-коммуникационных технологий (ИКТ) и информационных технологий (ИТ) из-за более высоких требований к центрам обработки данных в ИТ-индустрии привлекло внимание к стратегиям снижения энергопотребления центров обработки данных [1]. В последние годы растет интерес к снижению энергопотребления центров обработки данных, в том числе ИТ-оборудования и охлаждающих устройств. С этой целью авторы в [2] показали, что энергопотребление системы охлаждения охватывает более половины общего энергопотребления в крупном центре обработки данных за счет типичного разбивки распределения электрической мощности между различными нагрузками. Другое исследование в [3] представляет несколько тепловых методов для назначения задач, чтобы уменьшить общее энергопотребление центров обработки данных. Однако эти методы неэффективны при оперативном управлении энергопотреблением из-за вычислительной нагрузки используемых моделей CFD. Работы в [4], [5] также являются другими примерами сетевого задания, основанного на моделировании CFD. Есть также несколько примеров, в которых интерактивное планирование на основе датчиков используется с меньшими вычислительными затратами [6], [7]. Авторы в [1] также разработали математический метод для объединения серверов ON в шасси и стойках.
В ходе исследования рассматриваются изменения процессов при снижении энергопотребления в центрах обработки данных. По мере того, как масштабируется до нанометровой области, количество изменений процесса увеличивается, что, в свою очередь, приводит к огромному отклонению в потребляемой мощности утечки у изготовленных микросхем. Корпорация Intel сообщила, что изменчивость процесса может привести к 20-кратному изменению мощности утечки чипа в высокопроизводительных процессорах, изготовленных по технологии 180 нм [8]. Потребляемая мощность при утечке в зависимости от ее изменчивости рассматривалась как серьезная проблема для технологии проектирования в течение следующих 15 лет [9]. Следовательно, энергопотребление одинаково изготовленных серверов (например, разместить сервер можно в RackStore) в центре обработки данных больше нельзя считать одинаковым, что приводит к гетерогенному центру обработки данных. Без учета изменений процессов существующие проблемы в управлении питанием в центрах обработки данных являются неполными. Например, исследования, учитывающие тепловые характеристики, такие как [3], могут привести к неправильной настройке температуры охлаждения из-за неоднородности энергопотребления серверов, вызванной изменением процесса. Это приводит к увеличению частоты отказов оборудования и времени отклика из-за перегрева серверов. Подход консолидации шасси, представленный в [1], может также привести к неправильному выбору шасси ON без учета изменений процесса. Это, в свою очередь, влияет на правильный выбор температуры охлаждения и общее энергопотребление центра обработки данных.
В ходе исследования предложен алгоритм размещения серверов и назначения задач с учетом изменений, чтобы минимизировать общее энергопотребление центров обработки данных. Метод размещения сервера пытается найти оптимальное размещение сервера в центре обработки данных на основе характеристик мощности серверов и модели рециркуляции тепла в центре обработки данных. Рециркуляция тепла в центре обработки данных может быть смоделирована как матрица перекрестных помех с использованием инструментов CFD, используемых в [6]. Затем мы используем метод консолидации шасси с учетом изменений, а также процесс назначения задач, чтобы снизить энергопотребление центра обработки данных. Это обеспечит назначение входящих задач минимальному количеству включенных шасси среди тех, которые оказывают меньшее влияние на общее энергопотребление. Формулируется новая методика назначения задач и консолидации шасси как метод целочисленного линейного программирования. Результаты моделирования показывают улучшение общего энергопотребления центра обработки данных по сравнению с методом случайного размещения сервера. Таким образом, наш вклад в эту работу описывается следующим образом:
• Насколько известно, в этом исследовании первыми обратились к эффекту вариации в оптимизации энергопотребления центра обработки данных.
• Вводится метод размещения серверов, который определяет наилучшую позицию для каждого сервера на основе его характеристик энергопотребления при изменении процесса и модели рециркуляции тепла в центре обработки данных. Это гарантирует, что жадные до мощности серверы размещаются в шасси, что обеспечивает меньший вклад в общее энергопотребление центра обработки данных.
• Также учитывается изменение процесса при выполнении консолидации шасси для назначения задач. Это гарантирует, что использование жадного до мощности шасси сведено к минимуму, что приводит к более эффективному снижению энергопотребления.
После глубокого исследования проблемы был предложен способ размещения серверов и назначения задач с учетом изменений для снижения энергопотребления в центре обработки данных. Введён метод размещения серверов на основе ILP, чтобы найти наилучшее расположение каждого сервера в центре обработки данных. Также использован метод консолидации шасси с учетом изменений в процессе назначения задач, чтобы эффективно отключать незанятые шасси с различными коэффициентами использования для экономии энергии. Экспериментальные результаты показали, что при использовании предложенного нами метода размещения на сервере вместе с методикой консолидации шасси с учетом вариаций до 14,85% мощности произвольного размещения серверов.
Поскольку технология масштабируется в глубокие субмикронные режимы, влияние изменений процесса на производительность и энергопотребление процессоров быстро возрастает. Анализ эффективности нашего подхода в более высоких вариациях утечки является нашей будущей работой. Также планируется использовать более точную и структурированную модель изменения процесса, основанную на реальных измерениях.
Использованные источники
[1] E. Pakbaznia and M. Pedram, “Minimizing data center cooling and server power costs,” ISLPED09 Proceeding of the 14th ACM/IEEE International Symposium on Low Power Electronics and Design, pp. 145-150, 2009. [2] R. Sawyer, “Calculating total power requirements for data centers,” White Paper, 2004. [3] Q. Tang, K. S. Gupta, D. Stanzione, and P. Cayton, “Thermal-aware task scheduling to minimize energy usage of blade server based datacenters,” 2nd IEEE International Symposium on Dependable, Autonomic and Secure Computing, pp. 195-202, 2006. [4] J. Choi, Y. Kim, A. Sivaubramaniam, J. Srebric, Q. Wang, and J. Lce, “A CFD-based tool for studying temperdture in rack-mounted server,” IEEE Trans. Comput, vol. 57, pp. 1129-1142, 2008. [5] A. H. Beitelmal and C. D. Patel, “Thermo-Fluids provisioning of a high performance high density data center,” Distributed and Parallel Databases, vol. 21, no. 2-3, pp. 227-238, 2007. [6] Q. Tang, K. Kumar, S. Gupta, and V. Georgios, “Energy-Efficient Thermal-aware task scheduling for homogeneous high-performance computing data centers: A cyber-physical approach,” IEEE Transaction on Parallel and Distributed Systems, vol. 19, no. 11, pp. 1458-1472, 2008. [7] Q. Tang, T. Mukherjee, K. S. Sandeep, K. S. Gupta, and P. Cayton, “Sensor-based fast thermal evaluation model for energy efficient high-performance datacenters,” Proc. Int’l Conf. on Intelligent Sensing and Info. Process, pp. 203-208, 2006. [8] S. Borkar, et al., “Parameter variations and impact on circuits and microarchitectures,” Design Automation Conference, pp. 338-342, 2003. [9] “International technology roadmap for semiconductors overview,” ITRS, 2008 Update, url: itrs.net/reports.html [10] L. Wang, G. Laszewski, J. Dayal, and T. R. Furlani, “Thermal aware workload scheduling with backfilling for green data centers”, Conference (IPCCC), pp. 289-296, 2009 [11] F. Wang, C. Nicopoulos, X. Wu, Y. Xie, and N. Vijaykrishnan, “Variation-aware task allocation and scheduling for MPSoC,” IEEE/ACM International Conference on Computer-Aided Design (ICCAD’07), Nov. 2007. [12] M. Momtazpour, M. Goudarzi, E. Sanaei, “Variation-Aware Task and Communication Scheduling in MPSoCs for Power-Yield Maximization,” IEICE Trans. Fundamentals of Electronics, Communications and Computer Sciences (Special Section on “VLSI Design and CAD Algorithms”), E93-A(12), pp. 2542-2550, Dec. 2010. [13] M. Momtazpour, M. Goudarzi, E. Sanaei, “Static Statistical MPSoC Power Optimization by Variation-Aware Task and Communication Scheduling,” Elsevier Journal of Microprocessors and Microsystems, in press, Feb. 2012. [14] sun.com/x64/intel/consolidateusingquadcore.pdf [15] H. Chang, “Circuit timing leakage power analysis under process variations,” A Phd Dissertation of University of Minnesota, Feb. 2006. [16] G. B. Sirsi, ‘‘Leakage power optimization flow,’’ International Cadence Usergroup Conference, 2004. [17] S. Ghosh and K. Roy, “Parameter variation tolerance and error resilency: new design paradigm for the nanoscale era,” Proceedings of the IEEE, vol. 98, no. 10, pp. 1718-1751, 2010. [18] J. Moore, J. Chase, P. Ranganathan, and R. Sharma, “Making scheduling ‘Cool’: Temperature-aware resource assignment in data centers,” Usenix Annual Technical Conference, 2005. [19] Y. A. Cengel, “Heat transfer: a practical approach,” 2nd edition, McGraw-Hill, 2003. [20] newservers.com/1855-specs.pdf [21] R. E. Rosenthal, ‘‘GAMS-a user guide,’’ GAMS Development Corporation, 2010. [22] R. Rao, A. Srivastava, D. Blaauw, and D. Sylvester, “Statistical estimation of leakage current considering inter- and intra-die process variation,” Low Power Electronics and Design, ISLPED, pp. 84- 89, 2003. [23] L. Barroso and U. Holzle, “The case for energy-proportional computing,” IEEE Computer, Jan 2007.Variation-aware Server Placement and Task Assignment for Data Center Power Minimization
Ali Pahlevan
If you found an error, highlight it and press Shift + Enter or click here to inform us.