Wyniki 1-2 spośród 2 dla zapytania: authorDesc:"FILIP MISIOREK"

Poprawa precyzji obliczeń zmiennoprzecinkowych w GPGPU za pomocą dwóch akumulatorów


  Obliczenia ogolnego przeznaczenia na procesorach graficznych (GPGPU) sta.y si. w ostatnich latach wa.n. i szybko rozwijaj.c. si. dziedzin. technik programowania. Ogromne mo.liwo.ci przyspieszenia oblicze., ktore mo.na zrownolegli. powoduj., .e coraz wi.cej prac naukowych jest po.wi.conych rozwijaniu technik GPGPU. Proponowane rozwi.zania u.atwiaj. korzystanie z nowych mo.liwo.ci sprz.tu i oprogramowania [5], ale niestety obserwuje si. brak rozwa.a. dotycz.cych zwi.kszenia dok.adno.ci oblicze.. Jest to spowodowane nie zawsze poprawn. opini., .e obliczenia zmiennoprzecinkowe oferuj. wystarczaj.co dok.adne rezultaty. W przypadkach oblicze. wra.liwych na niedok.adno.ci oblicze., szczegolnie, gdy grozi to niestabilno.ci. numeryczn., a tak jest cz.sto w przypadku filtracji cyfrowej, obliczenia zmiennoprzecinkowe mog. prowadzi. do znacznie wi.kszych zagro.e. ni. sta.oprzecinkowe [4]. W nowych rozwi.zaniach nale.y wi.c pos.ugiwa. si. tak.e klasycznymi rozwa.aniami dotycz.cymi b..dow zaokr.gle., czy niedok.adno.ci oblicze. zmiennoprzecinkowych [1, 3, 8, 9]. Zatem mimo wielu zalet reprezentacji zmiennoprzecinkowych, maj. one te. istotne wady, ktore nale.y pokonywa.. Niniejszy artyku. jest po.wi.cony pewnemu aspektowi tego ogolnego zagadnienia. W artykule przedstawiono, na przyk.adzie filtrow o sko.czonej odpowiedzi impulsowej (ang. Finite Impulse Response, FIR), rozwa.ania dotycz.ce zwi.kszenia dok.adno.ci oblicze. przy ograniczeniach sprz.towych i przy rownoczesnym zachowaniu szybko.ci dzia.a.. Punkt pierwszy prezentuje przegl.d problemow teoretycznych dotycz.cych zwi.kszania dok.adno.ci oblicze. zmiennoprzecinkowych, punkt drugi prezentuje metod. dwoch akumulatorow, b.d.c. przyk.adem rozwi.zania nale..cego do klasy metod oblicze. o quasi-maksymalnej precyzji, punkt trzeci prezentuje ewolucj. i stan obecny procesorow graficznych ze szczegolnym naciskiem na dok.adno.. oblicze.. W kolejnych rozdzia.ach podane s. wyniki eksperymentu [...]

Fast and accurate digital signal processing realized with GPGPU technology

Czytaj za darmo! »

An idea of the so-called quasi-maximum accuracy computations for improvement of precision of the floating-point digital signal processing with graphic processing units (GPUs) is presented in this paper. In the presented approach, the increase of the precision of computations does not need any increase of the length of the data words. Special attention has been paid to efficiency and precision of computations. The maximum accuracy has been analyzed and technically realized with no additional costs in hardware and computation time. Streszczenie. W artykule zaproponowano wykorzystanie obliczeń zmiennoprzecinkowych o quasi-maksymalnej dokładności do cyfrowego przetwarzania sygnałów za pomocą procesorów graficznych (GPU). W zaprezentowanym rozwiązaniu, zwiększenie precyzji obliczeń nie wymaga zwiększenia długości słów danych. Szczególną uwagę zwrócono na efektywność przeprowadzanych obliczeń. Idea użycia obliczeń o maksymalnej precyzji została technicznie zrealizowana bez dodatkowych kosztów w sprzęcie i w czasie obliczeniowym. (Szybkie i dokładne cyfrowe przetwarzanie sygnałów z wykorzystaniem technologii GPGPU) Słowa kluczowe: liczby zmiennoprzecinkowe, GPGPU, CUDA, maksymalna precyzja obliczeń, dwa akumulatory, generator cyfrowy Keywords: floating-point numbers, GPGPU, CUDA, maximum accuracy, two accumulators, digital generator Introduction A famous Fettweis-Orchard theorem formulated in the 60-thies of the previous Century explains marvelous properties of passive lossless electronic filters [1, 2]. Furthermore, almost since the beginning of the era of digital signal processing (DSP), it is known that digital lossless systems, i.e. those, which losslessly and passively (or more precisely - structurally losslessly) transmit the signal power (or the “pseudopower" as it was originally referred to) are stable (even under looped conditions), insensitive to coefficient errors, and tolerant to computational inaccuracies [3]. Examples of[...]

 Strona 1