abstract
| - right|thumb|Процессор со снятым вентилятором. Хорошо видны регистры общего пользования. Проце́ссор — часть компьютера, высокотехнологичное устройство, содержащее в себе все знания (в смысле — ошибки) из математики, накопленные большей частью человечества. В качестве составных частей процессора можно выделить сумматор, вычитатор, умножатор, делятор и вентилятор. Последние модели процессоров фирмы Intel также содержат корнеизвлекатор и степенятор плюс ко всему дизъюнкатор, конъюнгатор и фаллоимитатор. Кроме вышеперечисленных элементов процессор также содержит Регистры общего пользования, Арифметико-жужжальное устройство (АЖУ), и систему входа-выхода. Производительность процессора определяется его быстротой пропускания (мм/нс) и количеством операций, которые могут выполняться одновременно. Принято считать, что процессоры являются неизбежной причиной работы компьютера, но на самом деле эти устройства достаточно умны, чтобы заставить работать всю систему, пребывая в отдыхе.
- thumb|Ballistics CPU в меню создания класса Процессор (англ. Ballistics CPU) — новый модуль на снайперские винтовки в Call of Duty: Black Ops II. Данный модуль уменьшает раскачивание прицела, аналогично оружейному умению Стабильность в MW3. Устанавливается только на снайперские винтовки со стандартным прицелом или с прицелом переменной кратности.
- Divicenzo 1994 Правила Дивиченцо: 1.
* точное число частиц 2.
* возможность переводить систему в точноизвестное наачальное состояние 3.
* высокая степерь изоляции от внешней среды 4.
* возможность менять состояние системы согласно заданной последовательности элементарных преобразований 5.
* наличие системы сильны измерений которые переводят систему в одно из чистых состояний Элементарный ностель информации q-bit. Алгоритм Шора — решение задачи о разлоении целого числа на простые множители. Быстрая одноквантовая логина RSFQ — используется Джозефсоновский переход. Создается из сверхпрроводника, получается триггер который может хранить информацию... вечно ) работает очень быстро. Универсальная — ячейка памяти + вычислительный элемент. Хранит или не хранит ток = 1 или 0, или даже другие значения, т.к. Токи могут квантоваться. Так же можно использовать оптические явления — от вывода информации (монитор), ввода инф (мышка, сканер), системы зранения (лазерные диски), кристальная память ), системы коммуникации (оптоволокно) — везде кроме вычислительных модулей. (но в ближайшем будущем это исправится — и даст очень большую скорость, меньшее энергопотребление, но, т.к. Свет только по прямой, системы будет сложно устраивать.) 1.
* персональные — универсальность, понятность, доступная цена (ibm pc, macintosh) 2.
* рабочие станции(графические сттанции - sgi) — пк для рассчётных задач, обработки большого кол-ва инф, больше ресурсов, но по большой цене 3.
* суперкомпьютеры (cray-1 как круглый диванчик), также hpc — high performance computing 1.
* сетевой сервер — занимаются полезным вещами по сети, не имеют моника и клавы. (cisco) 2.
* сервер данных — для хранения больших массивов данных и доступа к ним. Требования: большой обьем и надежность постоянных накопителей; высокая скорость доступа к данным; параллельный доступ к данным; обеспечение безопасности хранения инф; 3.
* игровые компьютеры — обеспечение высокого качества видео и звука; обеспечение удобства взаимодействия с игровой системой (джойстики, рули, и т.п) 4.
* системы реального времени — ракеты, реакторы и т.п. Первый подобный комп в 1946г!! два разных типа: система выдающая ответ за время много меньше чем время изменения параметров окружения; система в кот каждая операция выпболняется за ранее известное время 5.
* портативные компьютеры — первый комп — осборн, с аккумуляторами+подключение к сети. Требования — малый вес, средства коммуникации. В 6.
* карманные компьютеры. Первый кпк — 1996г,palm. Ама тралли вали пам-парам всем привет ууух!!!!!!!Дф Процессорные архитектуры Под процессороной архитектурой понимается процессорный набор команд. Архитектура фон Неймана — вычислительная система должна сстоять из: модуля управления (control unit), арифметико-логическое устр-во, (alu), память(memory), алу через акумуляторы и input & output взаимодействует с окр.средой. Везде взаимодействия в обе стороны. 1.
* память единственная и последовательно организованная. (ячейки друг за другом и посл.нумерованы) 2.
* линейная и одномерная (последовательная нумерация и одно число чтобы задать адрес) 3.
* отсутствие явного разделения между командами и данными, определяется во время исполнения. 4.
* Назначение данных не является их неотъемлемой частью, определяется логикой программы. Архтектура разделяет ... негативные последствия — яркий прмер — ДОС (работает по Нейману)— библиотека системных прерываний, она располагалась в самом начале памяти. Но например в Си есть адресация, и необходимость инициализации, если неинициализованы данные — пишется в нулевые адреса, что виснуло Дос и могло даже портить железо. Процессорные архитектуры (хороший сайтик): 1. (простейшие) a) Аккумулятор. Процессорная архитектура на аккумуляторе является простейшей. Акк — простейшая ячейка в памяти, где можно хранить одну единицу инф. выполнение операций (например сложения) подобно элементарному калькулятору: load add 3 store b) Стек. Есть несколько ячеек, организованных спец.образом. (как чипсы принглз) LIFO — last in first out, НЕ очередь, где first in first out. Очередь реализуется в буфере. Лифо удобнее при вызовах подпрограмм. Здесь у арифм. Опер. Нет операндов, есть только load 3 load 5 store . c) регистровая структура. General purpose registers, special registers. Любой регитр доступен независимо. 2. (cisc и risc, risc чуть ниже) Развитие пошло сначала по пути увеличения кол-ва и сложности комманд которые может выполнять сам процессор (Complex Instruction Set Cmputer). Свойства CISC: 1) много команд, 2) много способов адресации данных(к примеру «дайте мне такие-то данные, начиная от такой-то ячейки с шагом таким-то»), 3) комманды имеют переменную длинну (т.к. некоторые комманды проще, некоторые слонее), 4) количесво регистров не очень большое (8, 12). Примеры CISC: intel до пентиум2, текущие тоже имеют набор CISC, второй пример DEC(VAX), Motorolla 68000, накладные расходы на стали слишком сильно мешать. 3. Конвеер.1) Команду нужно загрузить2) Декодирование комманды3) Загрузить операнды(данные)4) Выполнение комманды5) Запись резуультатаэти шаги присутствуют на любом процесоре. Работают последовательно, но друг другу не мешают и выполняются на разных блоках, более того некоторые этапы(к примеру выполнение) выыполняются на разных блоках (алу, блок перехода). Отсюда сразу придумываем а не делать ли это конвеером. Но не всё так просто, как минимум некоторые операции могут занять очень много времени и тогда нужно ждать всем. Хуже когда следуще операции зависят от предыдущих. a=10; a=5; b=a; не ясно что успеет назначится переменной а когда она нужна будет для b. Минусы циск — хотя тактовая частота увеличивалась, скорость вычислений была небольшой. Занимались исследованиями в ибм ) это закрытая обл и её не опенсорсят ) в ибм делали 701пс. В сша два классных иссл. Центра — стенфорд и беркли (( там то и разработали риск. RISC (reduced ...) урезанное колич команд, но оч быстро выполняются. Способов адресации мало, т.к. Ещё один способ — подготовить данные к операции.операции выполняются над регистрами. Есть спец.комадны, которые загружают и выгружают данные из регистров — лоад и сторе. Команды имеют фиксированный размер. Регистров стало много больше. Промежуточное явл - «лоад сторе архитектура». В основном теоретические. - ибм 801 (1974г), мипс (microprocessor (with) interlocked pipeline — конвеер stages. - из стенфорда.) РИСК процессоры — паверпц (классический, исследования аппле ибм и моторола), хотя циск выигрывал чисто за счет увеличения частоты, риск был оч дорогой, так что риск не был оч популярен вначале. Только после спец.улучшений. Ещё пример — спарк (scalable proc arcitecture) «изюменка» - регистровые окна: в начальных спарках общих регистров 120, но процессору доступна только часть, окошко из 24 регистров. т.к. Средняя программа состоит из 70% переходов (программа есть неск.подпрограмм, все операции между — переходы. Переходы можно составить в стек -лифо. В спарке каждое рег.окно поделено на три части, причем первая часть есть посл.часть предыдущего окна. Такая схема не потребует перезаписи данных. Конструкция высокоэффективна и исп.до сих пор. Похожая процедура — переименование регистров. (относится к циску в основном) рег. Ах — временно ес, потом обратно ах.) . п.с powerpc = performance optimization with enraced risc АRМ. - адвансед риск машинес. Облегчается процесс условных переходов — каждая команда при выполнении проверяет четыре флажка — состояния (тега) если в программе стоит пометка -проверить определенный тег. Если он 0, то команда вообще не выполняется. За счет этого намного повышается эффективность выполнения программ. Но на сложных программах это гораздо сложнее, поэтому арм для несложных программ. Сеейчас армы купил интел он сецчас называется xscaled 11.10.08 в научных вычислениях самая частая задача — решение систем линейных уравнений. Для таких задач был изобретены векторые процессоры (сам процессор умеет обращаться с векторами). Для этого процессора характеры — векторные регистры и векторные команды. За один машинный такт обрабатывалось более одной единицы данных (или команды??). Невекторные процессоры = скалярные. Но в скалярных процессорах тоже решили выполнять за один такт бболее одной команды. Команды в конвеере выполняются в физически разных областях (кеш, алу и тд). Система, выполняющая за один такт более одной команды = суперскалярные системы. (НЕ: команду меньше чем за шаг. Команда всегда минимум один такт требует.)
* архитектура на сверхдлинном машинном слое (vliw — very long instruction word) машинное слово зависит от архитектуры (размер шины адреса — слово). Машинное слово — слово, кодирующее команду. В циске фиксировано м.с, в риске — нет. В данной архитектуре машинное слово = 256 бит. Одна инструкция кодирует команды сразу для нескольких исполняющих устройств (фиу = функциональное исполняющее устройство, например алу). Пример процессора — transmeta cruser. В нем два алу. Фиу для вычислений с плавающей точкой = fpu = floating point unit — у этого процессора их тоже два. + чтение + запись (load + store) + операция сравнения (compare)+ .пераця перехода (branch). Каждая из ячеек = 256 бит, за каждый новый такт процессор независимо обрабатывает 8 команд. Здесь нет конвейра. Планировщик формирует слова для этой (исполняющей) части процессора. Ячейка компаре работает по принципу выставления флагов (в слове состояния). Также флаг выставляется в алу, если случилось переполнение. Одни из старых известных длиннословных процессоров — cydrome 80. в 90х годах — transmeta crusoe — как низкоэнергопотребительные и менее тепловыделительные. Больше всего выделяет тепла планировщик :) специализация на лаптоп. Трансмету купил Виа. Трансмета хорошо продавала процессоры тольок первые два года. Она проиграала «гонку нанометров» и «гигагерц». Процессор sharc = super harvard single chip architecture computer сейчас они используются в крылатых ракетах и радиоуправляемых устройствах. (похоже там память тоже находится на чипе — сингл чип) и это система реального времени.
* архитектура с явным параллелизмом команд. Epic = explicitaly parallel instruction computer . Принципы: 1. создание плана выполнения во время компиляции (poe =plan of execution, roe= record of execution). 2 . использоование компилятором вероятностных оценок. 3. возможность передачи пое аппаратуре. 4. предикатное выполнение переходов. 5. спекулятивное управление 6. возможность перемещения кода. (ООО out of order — внеочередное выполнение.) план выполнения = все возможные способы которыми программа может быть исполнена с учетом оптимизации. Первые два пункта подчеркивают что компилятор должен компилировать очень тщательно, с учетом всех фиу и т.п. Рекорд оф екзекьюшн — то как эта программа будет выполнена. Спекулятивное выполнение — многие операции можно сделать зарание. Бываю спекуляции по выплнению и спекуляция по данным. Первое это то что мы можем сделать оба действия, а потом узнав какую ветвь на самом деле надо делать и выбрать результат. Спекуляция по данным: a=1; a=a+b; c=3.0*a; можно посчитать c для a равного 1, надеясь на то что b=0 и тогда после операции a=a+b; нам может повести и а будет верное. 18.10.08 Есть параллелизм уровня инструкций ilp — instrucrion level parallelism и tlp — thread level parallelism. В тлп регист ы, стек и обслуживающие элементы. 1. coarse grathed состоит из двух контекстов, переключение по прерыванию, таймаут. Такой механизм был только у ранних поверпс. Есть 2 контекста, переключения по прерыванию. 2. fine grained — мелко зернистый. N контекстов. Переключение по принципу разделеня времени — на исполнение каждого потока команд н-1 (m) такт или кратное этому. Максимальное количество команд предвыборки — 80 у альфа. В павер 4 два конвеера. Процессор умеет пораждать процесс и переключаться. Для рождения процесса есть инструкции. 3. Smt — simultaneous multi threading — одновременное выполнение разных нитей. - можно использовать разные контексты одновременно, (hyperthreading) регистры удобно меняются для оптимизации процессора. (alpha 21464) 4. cmp (многоядерность) chip multrocessing здесь на одном кристалле два полноценных процессора. (power 4, sun t1000 — niagara по 4,6,8 ядер sparc2, но слабые типа 484, и на них всего 1 фпу. у всех таких процессоров risc архитектура) есть cell. (ibm sony toshiba) изначально разрабатывался для плейстейшн портабл. Состоит из модулей — spu. У каждого собственный набор команд. Они получают на вход данные и преобразуют. Не использют регистры. Нет кешей, но есть локальная память. Не кеш т.к. Не прослойка между внешней памятью и юнитом. Всех их контролирует ppe (power processing eelement) spu = synergistic — то есть не работает сам по себе. Алгоритмы преобразования могут быть загружены на ячейки, а не прошиты в них. Полезно для игрушек, т.к. Там для каждого кадра цикл преобразований, после какого то момента картинка не меняется. Преобразования пропускаются через спу по очереди. (похоже на конвеер) ИБМ предложил делать такие процессоры вычислительными.т.е у целл разные типы ядер на одном кристалле. 5. системы на одном кристалле (soc — system on chip) типа и память и ввод вывод даже на один чип. («микросборка») - ibm blue gene . Есть embedded dram & power processors — здесь уменьшается энергопотребление.
|