Wyniki 1-7 spośród 7 dla zapytania: authorDesc:"Jakub Stankowski"

SZYBKA SYNTEZA WIDOKÓW WIRTUALNYCH DLA SYSTEMÓW TELEWIZJI SWOBODNEGO PUNKTU WIDZENIA DOI:10.15199/59.2018.6.41


  1. WSTĘP Głównym założeniem telewizji swobodnego punktu widzenia (FTV - free-viewpoint television) jest udostepnienie użytkownikowi możliwości płynnej zmiany punktu i kierunku widzenia [5], [15]. W przypadku wyboru punktu widzenia, którego położenie nie pokrywa się z położeniem którejkolwiek z kamer, konieczna jest synteza widoku wirtualnego (rys. 1). W związku z powyższym, opracowanie szybkiego i wydajnego algorytmu syntezy widoków wirtualnych jest kluczowe dla systemów telewizji swobodnego punktu widzenia. Rys. 1. Widok wirtualny względem widoków rzeczywistych 2. OPIS ALGORYTMU W celu uzyskania najwyższej możliwej jakości syntezowanych widoków wirtualnych, w zaproponowanym algorytmie użyto hybrydowej metody syntezy, łączącej zalety syntezy w przód (forward synthesis) [3] i wstecz (backward synthesis) [4], [7] Synteza wstecz pozwala na przefiltrowanie głębi widoku wirtualnego przed rzutowaniem informacji o kolorze, redukując tym samym wpływ niepoprawnie wyznaczonych, niespójnych map głębi. Wymaga ona jednak dwukrotnego rzutowania punktów - raz z widoków rzeczywistych na widok wirtualny i raz w stronę przeciwną. Synteza w przód wymaga wyłącznie jednego rzutowania każdego punktu, przez co jest operacją szybszą. W zaproponowanym hybrydowym podejściu punkty rzutowane są wyłącznie raz, a dzięki zapamiętaniu dokładnych pozycji, z których były one rzutowane możliwe jest uzyskanie podobnego efektu, jaki dałaby filtracja mapy głębi widoku wirtualnego. 2.1. Rzutowanie i łączenie głębi Każdy punkt w dowolnym widoku rzeczywistym może być reprezentowany poprzez wektor m=[x y z 1], gdzie x i y wyrażają pozycję danego punktu w widoku rzeczywistym, a z stanowi odpowiadającą mu wartość głębi. Podczas rzutowania głębi każdy punkt widoku rzeczywistego jest rzutowany do widoku wirtualnego zgodnie ze wzorem: 𝐦𝐕 = 𝐦 ⋅ 𝐏𝐕 ⋅ 𝐏𝐑 -1 , (1) gdzie mV = [xv yv zv 1] jest wektor[...]

WPŁYW ALGORYTMÓW DEMOZAIKOWANIA NA DOKŁADNOŚĆ KALIBRACJI SYSTEMÓW WIELOKAMEROWYCH DOI:10.15199/59.2017.6.74


  Systemy wielokamerowe są to systemy składające się ze zbioru kamer, które powinny być precyzyjnie zamontowane oraz dokładnie zsynchronizowane. Systemy takie umożliwiają nagrywanie sekwencji wizyjnych zawierających wiele widoków. Każdy z widoków stanowi sekwencję obrazów zmiennych w czasie. Systemy wielokamerowe stosuje się między innymi w telewizji swobodnego punktu widzenia, stereowizji czy dozorze wizyjnym. Mogą być stosowane także do tworzenia trójwymiarowych modeli obiektów, pomiaru odległości między obiektami lub wielkości przedmiotów. Telewizja swobodnego punktu widzenia (ang. Free viewpoint Television - FTV) [11] jest aktualnie rozwijanym rozwiązaniem, które w przyszłości może stać się konkurencją dla tradycyjnej telewizji. Tradycyjna telewizja oferuje widzowi tylko jeden punkt widzenia, wymuszony przez położenie kamer rejestrujących scenę i decyzje realizatora. Dzięki telewizji swobodnego punktu widzenia, widz dostaje możliwość wyboru dowolnego położenia kamery wirtualnej, ale nie tylko wybranej z dostępnego zbioru kamer. Może wybrać widok sceny, z dowolnego położenia pośredniego. Takie rozwiązanie może znacząco wpłynąć na widowiskowość wielu wydarzeń, między innymi spektakli teatralnych czy wydarzeń sportowych. W niniejszej pracy poruszono tematy związane z kalibracją systemów wielokamerowych oraz demozaikowaniem, gdyż są to dwa początkowe kroki, mające istotny wpływ na dalsze etapy przetwarzania obrazów w systemach wielokamerowych (rys. 1). Rys. 1. Schemat systemu FTV 2. WYBRANE ZAGADNIENIA SYSTEMÓW WIELOKAMEROWYCH 2.1. Kalibracja systemów wielokamerowych Chcąc pracować z systemami wielokamerowymi zawsze musimy dokonać kalibracji systemu (rys. 1) [6]. Niestety, kamery wyprodukowane w tym samym czasie, na jednej linii produkcyjnej, nawet z tej samej serii różnią się między sobą. Wynika to z wielu drobnych różnic, np. inne położenie matrycy względem układu optycznego kamery, czy niedoskonałości samego układu o[...]

NOWA TECHNIKA OPTYMALIZACJI DZIAŁANIA KODERA HEVC DOI:10.15199/59.2016.6.15


  NEW OPTIMIZATION TECHNIQUE OF THE HEVC VIDEO ENCODER Streszczenie: W pracy przedstawiono nową metodą szybkiego wyboru trybu kodowania wewnątrzobrazowego INTRA w koderze standardu HEVC. Podstawą opracowanej metody jest szczegółowa wiedza o częstości wybierania przez koder poszczególnych trybów kodowania wewnątrzobrazowego, w zależności od żądanej prędkości bitowej, rozdzielczości obrazu oraz jakości zakodowanego obrazu. Realizacja programowa opracowanej metody pozwoliła na pokazanie, że można płynnie regulować stopień przyspieszenia kodera i efektywność kodowania za jego pomocą. Abstract: The paper presents a new method of fast coding mode decision in the HEVC INTRA video encoder. The basis of the method is a detailed knowledge about frequency of using of individual coding modes in the encoder depending on the desired bitrate, spatial resolution of images, and the quality of coded images. Experiments showed a possibility of controlling the level of computations in the encoder at the cost of efficiency of video encoding. Słowa kluczowe: HEVC, kompresja obrazu, optymalizacja kodera, szybki koder obrazu ruchomego. Keywords: HEVC, video compression, video encoder optimization, fast video encoder. 1. WSTĘP Obecnie, ponad 60% wszystkich danych jakie są przesyłane w sieciach teleinformatycznych stanowią dane, które reprezentują obrazy ruchome. Co więcej, udział tych danych w ogólnym ruchu telekomunikacyjnym ciągle się zwiększa. Z tego powodu, od wielu lat podejmowane są bardzo intensywne prace, których celem jest opracowywanie coraz bardziej wydajnych sposobów reprezentacji ruchomego obrazu. Prowadzone w tym kierunku badania zaowocowały w ostatnich trzech latach opracowaniem nowej, wysokowydajnej techniki kompresji ruchomego obrazu, znanej jako HEVC (ang. High Efficiency Video Coding) [11]. Technika ta została w roku 2013 ujęta w międzynarodowych normach organizacji standaryzujących ISO/IEC oraz ITU-T i - w stosunku do powszec[...]

SZYBKIE TRANSKODOWANIE STRUMIENI HEVC POPRZEZ ELIMINACJĘ SKWANTOWANYCH WSPÓŁCZYNNIKÓW TRANSFORMATY O WARTOŚCI JEDEN DOI:10.15199/59.2017.6.60


  Transmisja obrazów w sieciach teleinformatycznych wymagać może zastosowania ściśle określonej wartości prędkości bitowej dla zakodowanego strumienia danych, który te obrazy reprezentuje. Poszczególne systemy transmisji obrazów (np. systemy mobilne, systemy telewizji cyfrowej, transmisja w internecie), stawiają jednak odmienne wymagania na prędkość bitową przesyłanych danych. Koncepcyjnie najprostszym rozwiązaniem tego problemu jest wielokrotna kompresja obrazów dla różnej prędkości bitowej. Jednakże przechowywanie wszystkich strumieni bitowych wymaga ogromnych pamięci masowych, co jest istotnym problemem. Odmiennym podejściem jest przechowywanie jednego tylko strumienia źródłowego, i późniejsze transkodowania na żądanie (On-Demand Transcoding) tego strumienia do wymaganej przez widza prędkości bitowej. Takie podejście staje się coraz bardziej powszechne ze względu na małe wymagania na pamięć i wciąż rosnące zasoby obliczeniowe w chmurze. Rozwiązanie z transkodowaniem zakodowanych wcześniej obrazów wymaga jednak szybkich, i zapewniających wysoką jakość transkoderów obrazu. 2. ANALIZA TRANSKODOWANIA HEVC Klasyczny transkoder obrazów jest prostym, szeregowym zestawieniem dekodera obrazów, który dokonuje dekompresji zakodowanego wcześniej strumienia, oraz kodera obrazów, który realizuje ponowną kompresję obrazów uwzględniając wymagania nałożone na parametry zakodowanego strumienia danych (np. prędkość bitowa nowego strumienia). Jednak stosowane w klasycznym transkoderze pełne kodowanie obrazów jest głównym powodem jego bardzo wysokiej obliczeniowej złożoności. Z perspektywy określonych zastosowań, np. działające na baterii systemy mobilne, ta wysoka złożoność jest ogromnym problemem. Z tego powodu powstają nowe projekty transkoderów, dzięki którym udaje się tę wysoką złożoność istotnie zmniejszyć. Cel ten osiąga się pomijając pewne kroki dekodowania zakodowanego strumienia lub upraszczając sam koder, który dokonuje ponown[...]

PRZYSPIESZENIE ESTYMACJI RUCHU ORAZ WYBORU PODZIAŁU CU W KODERZE HEVC DOI:10.15199/59.2017.6.76


  Kodowanie sekwencji wizyjnych z użyciem kodera HEVC [2][9] jest czasochłonne [8]. Nieosiągalna dla wcześniejszych metod kodowania sekwencji wizyjnych efektywność kodowania okupiona jest wielokrotnym wydłużeniem czasu kodowania sekwencji, w porównaniu ze starszymi metodami. Jest to na tyle dotkliwe, że aby ułatwić rozpowszechnienie techniki HEVC, konieczne jest przyspieszenie procesu kodowania. W ostatnich dwóch latach, w związku z wprowadzeniem techniki HEVC, problem przyspieszenia kodowania jest niezwykle silnie eksploatowanym polem badań naukowych i obszarem licznych wdrożeń opracowanych metod. Najważniejszym celem, stawianym przez badaczy, jest uzyskanie wyraźnego zmniejszenia złożoności obliczeniowej procesu kodowania międzyobrazowego, w tym sposobu wyznaczania wektorów ruchu oraz sposobu wyboru podziału bloków kodowania. Problem redukcji złożoności obliczeniowej procesu estymacji ruchu dotyczył również wcześniejszych technik, a opracowane dla nich metody, jak choćby te opisane w [3] są odpowiednio adaptowane i stosowane również w koderze nowej techniki HEVC, czyli w oprogramowaniu HM [7]. W artykule [6] i wcześniejszym [5], opisana została metoda wyznaczania podziałów bloków kodowania na podstawie złożonej analizy statystycznej. Dane statystyczne potrzebne do prawidłowego działania tej metody wymagają jednak fazy treningowej dla każdej sekwencji. Autorzy pokazują, że ich metoda daje do 60% przyspieszenia procesu kodowania przy nieznacznym wzroście prędkości bitowej generowanego strumienia. W artykule [11] autorzy prezentują metodę przyspieszenia procesu wyboru sposobu kodowania bloków obrazu z wykorzystaniem statystycznych zależności dotyczących sąsiednich bloków, dla których wybrany już został sposób kodowania. Metoda pozwala na zakończenie procesu podziału bloku w momencie uzyskania odpowiednio niskiej wartości funkcji kosztu, uwzględniając funkcje kosztu dla sąsiednich zakodowanych bloków. Przyspieszenie uzyski[...]

STEROWANIE KODEREM HEVC WYKORZYSTUJĄCE USUWANIE SZUMÓW DOI:10.15199/59.2017.6.77


  Postęp w rozwoju technik kompresji pozwala coraz bardziej efektywnie reprezentować obraz ruchomy. Najnowszą metodą kodowania opisaną w normach ISO/IEC oraz ITU jest technika HEVC [8]. Względem poprzedniej techniki AVC, HEVC pozwala uzyskać około 50% redukcję strumienia przy zachowaniu tej samej jakości [6]. Tak duży wzrost efektywności wynika ze znacznego rozwoju narzędzi kompresji dostępnym dla kodera. Przykładowo, wyliczyć można [3], iż dla jednostki kodowania LCU (Largest Coding Unit) koder HEVC ma do wyboru około 48 ∙ 1018 różnych kombinacji podziałów CU, TU, PU, 33 kierunki predykcji intra, oraz dwie listy referencyjne ze zmiennymi obrazami w predykcji inter. Z tego względu wybór trybów podczas kodowania jest jeszcze bardziej złożony niż w przypadku wcześniejszych technik, np. AVC. Wśród wszystkich dostępnych możliwości, koder poszukuje optymalnego zestawu trybów, które zmaksymalizowałyby stosunek jakośćprzepływność. Przejrzenie wszystkich możliwości w skali całego obrazu jest praktycznie niemożliwe i dlatego najczęściej wybór trybów optymalizuje się jedynie lokalnie na poziomie jednej jednostki LCU. Podejście takie jest zastosowane np. w oprogramowaniu modelowym HEVC grupy JCT-VC - HM [5]. Problem szybkiego wyboru trybów w jednostkach LCU kodera HEVC jest obecnie przedmiotem licznych prac naukowych (wyniki takich prac znaleźć można w publikacjach [9-26]), jednak prace te zakładają odmienny scenariusz kodowania obrazów w stosunku do tego który jest rozważany w tej pracy. Najszerszym zastosowaniem koderów wizyjnych jest kodowanie sekwencji naturalnych, rejestrowanych kamerami. Sekwencje takie charakteryzuje występowanie w nich szumu, w sposób nieunikniony powstającego w układach elektronicznych kamery. Szum jest w większości przypadków niepożądanym zakłóceniem, degradującym jakość sekwencji. Z kolei z perspektywy wyboru trybów, występowanie szumu w obrazie powoduje, że w danej jednostce CU wybierana jest taka[...]

Poznański kodek obrazów trójwymiarowych


  TECHNIKA OBRAZÓW TRÓJWYMIAROWYCH Obrazy stereoskopowe wykorzystuje się obecnie w wielu zastosowaniach. Przedmiotem badań naukowych są natomiast bardziej zaawansowane systemy obrazów trójwymiarowych drugiej generacji [1], które mają zapewniać widzom bardziej naturalną niż dotychczas percepcję obrazu przestrzennego. Na szczególną uwagę zasługuje obecnie szybko rozwijająca się technika monitorów autostereoskopowych, umożliwiających oglądanie obrazu stereoskopowego jednocześnie przez wielu widzów, którzy nie muszą w tym celu wykorzystywać żadnych specjalnych okularów. Monitor autostereoskopowy wyświetla jednocześnie wiele widoków tej samej sceny odpowiadających nieco innym punktom widzenia. Dla zapewnienia komfortu percepcji obrazu przestrzennego dużych rozmiarów monitor autostereoskopowy powinien wytwarzać dużą liczbę widoków. Obecnie produkowane monitory wytwarzają ich około 30, ale przewiduje się, że liczba ta zostanie zwiększona w przyszłych konstrukcjach. Dla pełnego wykorzystania swoich możliwości przyszłe monitory autostereoskopowe będą musiały otrzymywać reprezentację obrazu, która będzie bardziej bogata w stosunku do obecnie powszechnie wykorzystywanych par stereoskopowych. Dostarczania bogatszej reprezentacji obrazu przestrzennego będą wymagały także systemy, w których widz będzie mógł dostosowywać do swoich preferencji odległość bazową oglądanych obrazów stereoskopowych. Biorąc pod uwagę między innymi wspomniane zastosowania, przewiduje się, że w niedalekiej przyszłości - wraz z pewną liczbą widoków sceny - będą także przesyłane mapy głębi, w których wartości próbek reprezentują odległości do poszczególnych punktów obiektów sceny. Dla obrazów ruchomych mapy głębi oczywiście też są ruchome i zazwyczaj częstotliwość map głębi odpowiada częstotliwości obrazów. Z analizy różnych możliwych zastosowań wyłonił się prawdopodobny scenariusz przesyłania obrazów trójwymiarowych, dla których często stosowanym formatem będzie fo[...]

 Strona 1