KChernov
Silver Member | Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору Igorr Цитата: у меня на проце Athlon64 IVF медленнее чем CVF в ~3-4 раза(!) без всяких оптимизаций (в Debug) | А какой смысл сравнивать быстродействие в Debug? А вообще такая разница легко объяснима различными параметрами компилирования и сборки в Debug (у Интела с информативностью дебага получше будет, но ведь для этого и бесурсов больше надо). Но всё равно скорость надо сравнивать в Релиз, причём с одинаковыми уровнями оптимизации. Добавлено: CurlyDevil Цитата: То что quad precision вычисления идут существенно дольше совершенно нестранно, так как их нельзя сделать в регистрах процессора, а приходится мухлевать -- использовать алгоритмы длинной арифметики. | Это да, к сожалению современные 64х процы такие лишь для целых чисел. Правда есть ещё 80-битные сопроцессоры, но с ними как-то вообще всё мутно... Добавлено: Lapochka ili Chai Цитата: Народ, есть комп на процессоре Intel® Core™ i7 Q 820 @ 1.73GHz, имеющем 4 ядра + гипертрейдинг, дающие в целом 8 нитей (threads). Хочется сделать ФОРТРАН + MPI. Если это удастся, то на 4 или на 8 процессорах, как вы полагаете? Другими словами, что нужно для MPI-процессора -- ядро или нить настоящего каменного процессора? | Если у вас уже есть правильное MPI-приложение, то вам действительно всё равно, сколько потоков вы укажете при запуске. Соответственно проще всего запустить тестовый аналог этого приложения для 4 и 8 (на вашем проце) и сравнить. Мне кажется, что на 4 должно быть не медленнее, чем на 8, так как расчётная задача всё-таки в первую очередь грузит физические процы/ядра. Но когда когда-то давно (ещё при появлении её на Р4) я читал про технологию хиперсрёдинга (которая даёт в итоге из 4 физических ядер 8 виртуальных), речь шла про то, что эта технология запросто может дать доступ к простаивающим (при выполнении основной задачи) модулям вычисления процессора. Как щас с этим у современных процов - не в курсе, но если задача распараллеливается через MPI однородно по мощности и характеру вычислений, которые требует процесс, то и выигрыша от виртуальных ядер быть не должно (а скорее будет проигрыш из-за накладных расходов). Однако если задача распараллелена на процессы, где характер вычислений неоднороден (например одни нити считают в действительных числах, а другие в целых), вполне может быть выигрыш и от виртуальных ядер. | Всего записей: 2471 | Зарегистр. 20-04-2004 | Отправлено: 13:19 01-02-2011 | Исправлено: KChernov, 18:01 02-02-2011 |
|