Wyniki 1-7 spośród 7 dla zapytania: authorDesc:"Olgierd Stankiewicz"

TECHNIKI KODOWANIA I WYZNACZANIA MAP GŁĘBI STEREOSKOPOWEJ W SYSTEMACH TELEWIZJI WIELOWIDOKOWEJ DOI:10.15199/59.2015.4.72


  Artykuł stanowi podsumowanie i streszczenie rozprawy doktorskiej [1]. Przedstawiono osiągnięcia autora związane z opracowaniem nowych technik estymacji głębi oraz nowej techniki kodowania głębi wykorzystującej reprezentację nieliniową, która została włączona do specyfikacji międzynarodowych norm opisujących nowe techniki kodowania obrazu trójwymiarowego. Opisano również udział autora w opracowaniu poznańskiego kodeka obrazu trójwymiarowego oraz eksperymentalnego systemu wielokamerowego i sekwencji testowych. 1. WSTĘP Rozprawa [1] dotyczy nowej generacji systemów obrazu trójwymiarowego. Swoim zakresem obejmuje zwłaszcza systemy swobodnego punktu widzenia (free viewpoint navigation) i autostereoskopię. W stosunku do dotychczas znanych i stosowanych rozwiązań wykorzystujących stereoskopię, nowe systemy mają zapewnić lepsze wrażenia obrazu przestrzennego, lepszą reprodukcję struktury sceny oraz umożliwić widzowi oddziaływanie na widzianą scenę i jej oglądanie bez użycia specjalnych okularów. Zarówno nawigacja swobodnego punktu widzenia, jak i autostereoskopia, wymagają znacznej liczby widoków sceny, których akwizycja, przetwarzanie i transmisja byłaby niepraktyczna. Sposobem, który umożliwia efektywny opis sceny trójwymiarowej jest zastosowanie reprezentacji MVD (Multiview Video plus Depth) [2]. Reprezentacja sceny trójwymiarowej w formacie MVD składa się z ograniczonej liczby widoków oraz odpowiadających im map głębi, które przenoszą dodatkową informację na temat trójwymiarowej struktury sceny. Mapy głębi są obrazami, których wartości odzwierciedlają odległości pomiędzy daną kamerą a punktami w scenie. Wykorzystanie map głębi (rys. 1) pozwala na generowanie tzw. widoków wirtualnych. Widok wirtualny, czyli widok pochodzący z kamery umiejscowionej wirtualnie w scenie, nie jest rejestrowany a powstaje syntetycznie na podstawie treści zarejestrowanej przez kamery rzeczywiste. Taka wirtualna kamera może być umieszczona w dowo[...]

NOWE MEDIA IMMERSYJNE DOI:10.15199/59.2018.6.55


  1. WSTĘP Nazwa nowego rodzaju mediów, zwanych immersyjnymi (lub wszechogarniającymi), pochodzi od łacińskiego czasownika immergere, co oznacza zanurzenie się lub zanurzenie w czymś. W przypadku mediów cyfrowych jest to termin określający zdolność systemu technicznego do całkowitego "wchłonięcia" użytkownika w przedstawioną rzeczywistość. Multimedia immersyjne [1] mogą być związane zarówno z treścią naturalną, jak i generowaną komputerowo. W pracy skoncentrujemy się na treści naturalnej, która zastała zarejestrowana za pomocą kamer, mikrofonów i ewentualnie jest uzupełniana danymi z czujników dodatkowych, takich jak kamery głębi. Immersja ma różne aspekty, związane ze sposobami przekonywania naszych ludzkich zmysłów, że jesteśmy obecni w przedstawionej treści. W tym artykule koncentrujemy się na tych aspektach, związanych tylko z wizją. Przykładami mediów immersyjnych są rzeczywistość wirtualna, rzeczywistość mieszana i rzeczywistości rozszerzona, które ostatnimi czasy są bardzo dynamicznie rozwijane. Obecnie najbardziej obiecującymi urządzeniami do prezentacji obrazu, który pozwala na całkowite wchłonięcie widza są gogle VR (ang. Head Mounted Display), umieszczane na głowie i wyświetlające obraz bezpośrednio na wyświetlaczach umieszczonych wprost przed oczami widza. W ostatnich latach obserwuje się ciągły rozwój tego typu urządzeń w różnych skalach: od prostych opartych na smartfonach (Google Cardboard [2]) po dedykowane urządzenia współpracujące z komputerami PC (np. Oculus Rift) [3]. Rozwój i popularyzacja urządzeń umożliwiających immersję przyśpieszyły rozwój rynku i zintensyfikowały prowadzone badania. Obecnie trwają prace nad wieloma technologiami związanymi z immersją, z których każdy prezentuje różne poziomy/zakresy zanurzenia widza w prezentowany świat (realizm). Niektóre są bardzo ograniczone, np. pozwalają użytkownikowi zmienić tylko kierunek widzenia [4,5], podczas gdy inne są bardzo zaawansowane, np. pozwa[...]

NOWA TECHNIKA OPTYMALIZACJI DZIAŁANIA KODERA HEVC DOI:10.15199/59.2016.6.15


  NEW OPTIMIZATION TECHNIQUE OF THE HEVC VIDEO ENCODER Streszczenie: W pracy przedstawiono nową metodą szybkiego wyboru trybu kodowania wewnątrzobrazowego INTRA w koderze standardu HEVC. Podstawą opracowanej metody jest szczegółowa wiedza o częstości wybierania przez koder poszczególnych trybów kodowania wewnątrzobrazowego, w zależności od żądanej prędkości bitowej, rozdzielczości obrazu oraz jakości zakodowanego obrazu. Realizacja programowa opracowanej metody pozwoliła na pokazanie, że można płynnie regulować stopień przyspieszenia kodera i efektywność kodowania za jego pomocą. Abstract: The paper presents a new method of fast coding mode decision in the HEVC INTRA video encoder. The basis of the method is a detailed knowledge about frequency of using of individual coding modes in the encoder depending on the desired bitrate, spatial resolution of images, and the quality of coded images. Experiments showed a possibility of controlling the level of computations in the encoder at the cost of efficiency of video encoding. Słowa kluczowe: HEVC, kompresja obrazu, optymalizacja kodera, szybki koder obrazu ruchomego. Keywords: HEVC, video compression, video encoder optimization, fast video encoder. 1. WSTĘP Obecnie, ponad 60% wszystkich danych jakie są przesyłane w sieciach teleinformatycznych stanowią dane, które reprezentują obrazy ruchome. Co więcej, udział tych danych w ogólnym ruchu telekomunikacyjnym ciągle się zwiększa. Z tego powodu, od wielu lat podejmowane są bardzo intensywne prace, których celem jest opracowywanie coraz bardziej wydajnych sposobów reprezentacji ruchomego obrazu. Prowadzone w tym kierunku badania zaowocowały w ostatnich trzech latach opracowaniem nowej, wysokowydajnej techniki kompresji ruchomego obrazu, znanej jako HEVC (ang. High Efficiency Video Coding) [11]. Technika ta została w roku 2013 ujęta w międzynarodowych normach organizacji standaryzujących ISO/IEC oraz ITU-T i - w stosunku do powszec[...]

SZYBKIE TRANSKODOWANIE STRUMIENI HEVC POPRZEZ ELIMINACJĘ SKWANTOWANYCH WSPÓŁCZYNNIKÓW TRANSFORMATY O WARTOŚCI JEDEN DOI:10.15199/59.2017.6.60


  Transmisja obrazów w sieciach teleinformatycznych wymagać może zastosowania ściśle określonej wartości prędkości bitowej dla zakodowanego strumienia danych, który te obrazy reprezentuje. Poszczególne systemy transmisji obrazów (np. systemy mobilne, systemy telewizji cyfrowej, transmisja w internecie), stawiają jednak odmienne wymagania na prędkość bitową przesyłanych danych. Koncepcyjnie najprostszym rozwiązaniem tego problemu jest wielokrotna kompresja obrazów dla różnej prędkości bitowej. Jednakże przechowywanie wszystkich strumieni bitowych wymaga ogromnych pamięci masowych, co jest istotnym problemem. Odmiennym podejściem jest przechowywanie jednego tylko strumienia źródłowego, i późniejsze transkodowania na żądanie (On-Demand Transcoding) tego strumienia do wymaganej przez widza prędkości bitowej. Takie podejście staje się coraz bardziej powszechne ze względu na małe wymagania na pamięć i wciąż rosnące zasoby obliczeniowe w chmurze. Rozwiązanie z transkodowaniem zakodowanych wcześniej obrazów wymaga jednak szybkich, i zapewniających wysoką jakość transkoderów obrazu. 2. ANALIZA TRANSKODOWANIA HEVC Klasyczny transkoder obrazów jest prostym, szeregowym zestawieniem dekodera obrazów, który dokonuje dekompresji zakodowanego wcześniej strumienia, oraz kodera obrazów, który realizuje ponowną kompresję obrazów uwzględniając wymagania nałożone na parametry zakodowanego strumienia danych (np. prędkość bitowa nowego strumienia). Jednak stosowane w klasycznym transkoderze pełne kodowanie obrazów jest głównym powodem jego bardzo wysokiej obliczeniowej złożoności. Z perspektywy określonych zastosowań, np. działające na baterii systemy mobilne, ta wysoka złożoność jest ogromnym problemem. Z tego powodu powstają nowe projekty transkoderów, dzięki którym udaje się tę wysoką złożoność istotnie zmniejszyć. Cel ten osiąga się pomijając pewne kroki dekodowania zakodowanego strumienia lub upraszczając sam koder, który dokonuje ponown[...]

PRZYSPIESZENIE ESTYMACJI RUCHU ORAZ WYBORU PODZIAŁU CU W KODERZE HEVC DOI:10.15199/59.2017.6.76


  Kodowanie sekwencji wizyjnych z użyciem kodera HEVC [2][9] jest czasochłonne [8]. Nieosiągalna dla wcześniejszych metod kodowania sekwencji wizyjnych efektywność kodowania okupiona jest wielokrotnym wydłużeniem czasu kodowania sekwencji, w porównaniu ze starszymi metodami. Jest to na tyle dotkliwe, że aby ułatwić rozpowszechnienie techniki HEVC, konieczne jest przyspieszenie procesu kodowania. W ostatnich dwóch latach, w związku z wprowadzeniem techniki HEVC, problem przyspieszenia kodowania jest niezwykle silnie eksploatowanym polem badań naukowych i obszarem licznych wdrożeń opracowanych metod. Najważniejszym celem, stawianym przez badaczy, jest uzyskanie wyraźnego zmniejszenia złożoności obliczeniowej procesu kodowania międzyobrazowego, w tym sposobu wyznaczania wektorów ruchu oraz sposobu wyboru podziału bloków kodowania. Problem redukcji złożoności obliczeniowej procesu estymacji ruchu dotyczył również wcześniejszych technik, a opracowane dla nich metody, jak choćby te opisane w [3] są odpowiednio adaptowane i stosowane również w koderze nowej techniki HEVC, czyli w oprogramowaniu HM [7]. W artykule [6] i wcześniejszym [5], opisana została metoda wyznaczania podziałów bloków kodowania na podstawie złożonej analizy statystycznej. Dane statystyczne potrzebne do prawidłowego działania tej metody wymagają jednak fazy treningowej dla każdej sekwencji. Autorzy pokazują, że ich metoda daje do 60% przyspieszenia procesu kodowania przy nieznacznym wzroście prędkości bitowej generowanego strumienia. W artykule [11] autorzy prezentują metodę przyspieszenia procesu wyboru sposobu kodowania bloków obrazu z wykorzystaniem statystycznych zależności dotyczących sąsiednich bloków, dla których wybrany już został sposób kodowania. Metoda pozwala na zakończenie procesu podziału bloku w momencie uzyskania odpowiednio niskiej wartości funkcji kosztu, uwzględniając funkcje kosztu dla sąsiednich zakodowanych bloków. Przyspieszenie uzyski[...]

STEROWANIE KODEREM HEVC WYKORZYSTUJĄCE USUWANIE SZUMÓW DOI:10.15199/59.2017.6.77


  Postęp w rozwoju technik kompresji pozwala coraz bardziej efektywnie reprezentować obraz ruchomy. Najnowszą metodą kodowania opisaną w normach ISO/IEC oraz ITU jest technika HEVC [8]. Względem poprzedniej techniki AVC, HEVC pozwala uzyskać około 50% redukcję strumienia przy zachowaniu tej samej jakości [6]. Tak duży wzrost efektywności wynika ze znacznego rozwoju narzędzi kompresji dostępnym dla kodera. Przykładowo, wyliczyć można [3], iż dla jednostki kodowania LCU (Largest Coding Unit) koder HEVC ma do wyboru około 48 ∙ 1018 różnych kombinacji podziałów CU, TU, PU, 33 kierunki predykcji intra, oraz dwie listy referencyjne ze zmiennymi obrazami w predykcji inter. Z tego względu wybór trybów podczas kodowania jest jeszcze bardziej złożony niż w przypadku wcześniejszych technik, np. AVC. Wśród wszystkich dostępnych możliwości, koder poszukuje optymalnego zestawu trybów, które zmaksymalizowałyby stosunek jakośćprzepływność. Przejrzenie wszystkich możliwości w skali całego obrazu jest praktycznie niemożliwe i dlatego najczęściej wybór trybów optymalizuje się jedynie lokalnie na poziomie jednej jednostki LCU. Podejście takie jest zastosowane np. w oprogramowaniu modelowym HEVC grupy JCT-VC - HM [5]. Problem szybkiego wyboru trybów w jednostkach LCU kodera HEVC jest obecnie przedmiotem licznych prac naukowych (wyniki takich prac znaleźć można w publikacjach [9-26]), jednak prace te zakładają odmienny scenariusz kodowania obrazów w stosunku do tego który jest rozważany w tej pracy. Najszerszym zastosowaniem koderów wizyjnych jest kodowanie sekwencji naturalnych, rejestrowanych kamerami. Sekwencje takie charakteryzuje występowanie w nich szumu, w sposób nieunikniony powstającego w układach elektronicznych kamery. Szum jest w większości przypadków niepożądanym zakłóceniem, degradującym jakość sekwencji. Z kolei z perspektywy wyboru trybów, występowanie szumu w obrazie powoduje, że w danej jednostce CU wybierana jest taka[...]

Poznański kodek obrazów trójwymiarowych


  TECHNIKA OBRAZÓW TRÓJWYMIAROWYCH Obrazy stereoskopowe wykorzystuje się obecnie w wielu zastosowaniach. Przedmiotem badań naukowych są natomiast bardziej zaawansowane systemy obrazów trójwymiarowych drugiej generacji [1], które mają zapewniać widzom bardziej naturalną niż dotychczas percepcję obrazu przestrzennego. Na szczególną uwagę zasługuje obecnie szybko rozwijająca się technika monitorów autostereoskopowych, umożliwiających oglądanie obrazu stereoskopowego jednocześnie przez wielu widzów, którzy nie muszą w tym celu wykorzystywać żadnych specjalnych okularów. Monitor autostereoskopowy wyświetla jednocześnie wiele widoków tej samej sceny odpowiadających nieco innym punktom widzenia. Dla zapewnienia komfortu percepcji obrazu przestrzennego dużych rozmiarów monitor autostereoskopowy powinien wytwarzać dużą liczbę widoków. Obecnie produkowane monitory wytwarzają ich około 30, ale przewiduje się, że liczba ta zostanie zwiększona w przyszłych konstrukcjach. Dla pełnego wykorzystania swoich możliwości przyszłe monitory autostereoskopowe będą musiały otrzymywać reprezentację obrazu, która będzie bardziej bogata w stosunku do obecnie powszechnie wykorzystywanych par stereoskopowych. Dostarczania bogatszej reprezentacji obrazu przestrzennego będą wymagały także systemy, w których widz będzie mógł dostosowywać do swoich preferencji odległość bazową oglądanych obrazów stereoskopowych. Biorąc pod uwagę między innymi wspomniane zastosowania, przewiduje się, że w niedalekiej przyszłości - wraz z pewną liczbą widoków sceny - będą także przesyłane mapy głębi, w których wartości próbek reprezentują odległości do poszczególnych punktów obiektów sceny. Dla obrazów ruchomych mapy głębi oczywiście też są ruchome i zazwyczaj częstotliwość map głębi odpowiada częstotliwości obrazów. Z analizy różnych możliwych zastosowań wyłonił się prawdopodobny scenariusz przesyłania obrazów trójwymiarowych, dla których często stosowanym formatem będzie fo[...]

 Strona 1