Sign in to follow this
Followers
0
Intel ułatwi pracę programistom
By
KopalniaWiedzy.pl, in Technologia
-
Similar Content
-
By KopalniaWiedzy.pl
Podczas Fifth International Symposium on Networks-on-Chip 2011 specjaliści z MIT-u zdobyli nagrodę za najlepsze opracowanie naukowe symulatora układu scalonego. Ich program Hornet modeluje działanie wielordzeniowego procesora znacznie lepiej niż inne tego typu oprogramowanie. Potrafił znaleźć w oprogramowaniu błędy, których inne symulatory nie zauważyły.
Teraz Hornet został znakomicie udoskonalony i wyposażony w nowe funkcje. Jego nowa wersja potrafi symulować zużycie energii, komunikację między rdzeniami, interakcję pomiędzy CPU a pamięcią oraz obliczyć czas potrzebny na wykonanie poszczególnych zadań.
Symulatory są niezwykle ważne dla firm produkujących układy scalone. Zanim przystąpi się do produkcji kości przeprowadzane są liczne testy ich działania na symulatorach.
Dotychczasowe symulatory przedkładały szybkość pracy nad dokładność. Nowy Hornet pracuje znacznie wolniej niż jego starsze wersje, jednak dzięki temu pozwala na symulowanie 1000-rdzeniowego procesora z dokładnością do pojedynczego cyklu. Hornet jest nam w stanie wyliczyć, że ukończenie konkretnego zadania będzie np. wymagało 1.223.392 cykli - mówi Myong Cho, doktorant z MIT-u.
Przewaga Horneta nad konkurencją polega też na tym, że inne symulatory dobrze oceniają ogólną wydajność układu, mogą jednak pominąć rzadko występujące błędy. Hornet daje większą szansę, że zostaną one wyłapane.
Podczas prezentacji Cho, jego promotor profesor Srini Devadas i inni studenci symulowali na Hornecie sytuację, w której wielordzeniowy procesor korzysta z nowej obiecującej techniki przetwarzania danych pacjentów. Hornet zauważył, że niesie ona ze sobą ryzyko wystąpienia zakleszczenia, czyli sytuacji, w której różne rdzenie, aby zakończyć prowadzone obliczenia, czekają nawzajem na dane od siebie. Powoduje to, że zadania nie mogą być zakończone, gdyż rdzenie nawzajem siebie blokują. Żaden inny symulator nie zasygnalizował tego problemu. Hornet pozwolił też na przetestowanie zaproponowanego przez naukowców sposobu na uniknięcie zakleszczenia.
Zdaniem jego twórców Hornet, ze względu na swoje powolne działanie, posłuży raczej do symulowania pewnych zadań, a nie działania całych aplikacji. Przyda się zatem tam, gdzie zajdzie potrzeba upewnienia się, czy nie występują żadne nieprawidłowości czy też do statystycznego zbadania możliwości wystąpienia błędów.
-
By KopalniaWiedzy.pl
Asustek zaprezentował biurkowy superkomputer ESC1000. Urządzenie powstało we współpracy z Nvidią i tajwańskim Narodowym Uniwersytetem Chiao Tung. Zostało ono stworzone z myślą o zastosowaniu przez organizacje rządowe, naukowe i badawcze.
ESC1000 korzysta z procesora graficznego Tesla oraz technologii CUDA i zapewnia wydajność do 1,1 teraflopsa. To olbrzymia moc, zważywszy, że na ostatnim miejscu listy 500 najpotężniejszych superkomputerów znajduje się maszyna o wydajności 17,09 TFlops.
Za ESC1000 trzeba będzie zapłacić co najmniej 14 778 dolarów. Najbardziej wydajna wersja komputera będzie kosztowała niemal 21 000 USD.
-
By KopalniaWiedzy.pl
Nvidia zaprezentowała nową architekturę procesorów graficznych. Fermi ma być nie tylko następcą obecnie wykorzystywanej architektury G80. To także pierwszy procesor graficzny ogólnego przeznaczenia.
Jen-Hsun Huang podczas wstępnej prezentacji nowej architektury przedstawił ją jako architekturę GPU, jednak Fermi to coś więcej niż procesor graficzny. Dlatego też Nvidia pozycjonuje go bardzo ostrożnie, wskazując na jego przydatność we współpracy z CUDA.
Procesory wykonane w architekturze Fermi będą zawierały 512 rdzeni CUDA, czyli dwukrotnie więcej niż obecne GPU Nvidii, oraz 3 miliardy tranzystorów. Firma zapewnia, że udało się jej ośmiokrotnie zwiększyć szybkość wykonywania operacji zmiennoprzecinkowych podwójnej precyzji.
Kość składa się z 16 multiprocesorów strumieniowych (SM), na które przypadają po 32 rdzenie. Każdy z nich ma do dyspozycji 64 kilobajty przestrzeni pamięci L1, którą można skonfigurować albo jako 48 kB pamięci współdzielonej + 16 kB cache L1 lub też 16 kB współdzielone + 48 kB L1. Na każdy SM przypada również 768 kilobajtów współdzielonej pamięci L2.
Nvidia zastosowała też zunifikowaną przestrzeń adresową, dzięki czemu Fermi w pełni wspiera oprogramowanie napisane nie tylko w C, ale również w C++. Usprawnieniu operacji i lepszemu wykorzystaniu C i C++ służy też zaimplementowanie technologii Nvidia Parallel DataCache, dzięki której oba rodzaje pamięci cache obsługują wszystkie przeprowadzane operacje, które są dokonywane w ściśle określonym porządku. Dzięki wykorzystaniu pamięci L1 do przechowywania danych rejestru (wcześniej były one przechowywane bezpośrednio w pamięci RAM) uzyskano znaczne skrócenie czasu dostępu do danych. Natomiast współdzielona pamięć L2 umożliwia błyskawiczną wymianę danych pomiędzy poszczególnymi SM.
Fermi to pierwszy układ graficzny, w którym zaimplementowano obsługę ECC (Error Correcting Code), chroniącą dane przed błędami powodowanymi przez wpływ promieniowania kosmicznego.
Jedną z ważnych technologii wykorzystanych w Fermim jest Nvidia GigaThread Engine. Pozwala on na jednoczesne wykonywanie różnych obliczeń w kontekście tej samej aplikacji. Dzięki temu programy wykorzystujące liczne mikrojądra mają do dyspozycji całą dostępną moc obliczeniową. W przypadku tradycyjnego, sekwencyjnego przetwarzania mikrojąder, wykorzystuje się tylko część dostępnej mocy.
Fermi współpracuje z 384-bitowymi kośćmi GDDR5 i jest w stanie obsłużyć do terabajta pamięci. Obsługuje technologie DirectX 11, OpenGL 3.2 oraz OpenCL.
Przy okazji prezentacji architektury Fermi poinformowano, że Nvidia i Microsoft stworzyły środowisko programistyczne Nexus. Zostało ono opracowane na potrzeby masowych obliczeń równoległych i jest zintegrowane z Microsoft Visual Studio. Nexus będzie, oczywiście, korzystał z możliwości Fermiego.
Producent Fermiego podkreśla jego przydatność w obliczeniach naukowych i związek z CUDA, jednak z drugiej strony porównuje go do G80. Fermi może więc być układem wykorzystywanym zarówno superkomputerach jak i pecetach miłośników gier komputerowych.
-
By KopalniaWiedzy.pl
Microsoft kupił wydziały technologiczne firmy Interactive Supercomputing (ISC), która specjalizuje się w technologiach przetwarzania równoległego dla desktopów, a jej rozwiązania umożliwiają łatwiejszy dostęp do wysoko wydajnego przetwarzania danych.
"Microsoft planuje zintegrowanie technologii ISC w przyszłych wersjach swoich produktów. W najbliższych miesiącach dostarczymy więcej informacji na temat tego, w jakich produktach i w jaki sposób będzie przeprowadzania integracja" - czytamy w oświadczeniu koncernu. Firma podkreśla, że nowe technologie pozwolą jej na udoskonalenie produktów skierowanych na rynek HPC (High-Perfomance Computing).
Bill Blake, były prezes ISC, wraz z zespołem inżynierów specjalizujących się w przetwarzaniu równoległym i HPC, dołączyli do microsoftowego New England Research & Development Center w Cambridge, w stanie Massachusetts.
-
By KopalniaWiedzy.pl
AMD pracuje nad wielordzeniowym układem serwerowym Interlago, który pojawi się na rynku w 2011 roku. Kość będzie miała od 12 do 16 rdzeni. Wcześniej, bo w pierwszym kwartale 2010 zadebiutuje 12-rdzeniowy Magny-Cours.
Interlago będzie przeznaczony dla serwerów korzystających z dwóch lub czterech procesorów, a więc dla maszyn z maksymalnie 64 rdzeniami obliczeniowymi. Wiadomo, że będzie on stanowił część serwerowej rodziny Opteron 6000.
Głównym konkurentem Opterona są intelowskie Xeony. Na razie jednak, Intel nie zapowiedział żadnego Xeona, którego liczba rdzeni mogłaby dorównać Interlago. Wiadomo, że w 2010 zadebiutuje Xeon Nehalem-EX z 8 rdzeniami. Intel przygotowuje też wielordzeniowy układ Larrabee, jednak nie będzie to typowa kość serwerowa, a procesor przeznaczony dla superkomputerów specjalizujących się w renderowaniu grafiki trójwymiarowej.
AMD, jak widać, ma ambitne plany, jednak specjaliści zwracają uwagę, że firma na razie nie wspomina nic o wielowątkowości swoich układów. Nie wiadomo zatem, ile każdy z rdzeni będzie obsługiwał wątków.
-
-
Recently Browsing 0 members
No registered users viewing this page.