Wyniki 1-10 spośród 10 dla zapytania: authorDesc:"Tomasz Grajek"

PROSTY WIELOKAMEROWY SYSTEM REJESTRACJI OBRAZU NA POTRZEBY BADAŃ NAD TELEWIZJĄ SWOBODNEGO PUNKTU WIDZENIA DOI:10.15199/59.2017.6.59


  Nieustanny rozwój telewizji oraz rosnące wymagania stawiane przez widzów prowadzą do pojawiania się na rynku coraz nowszych rozwiązań. Obecnie jednym z systemów, nad którymi na całym świecie prowadzi się prace, jest telewizja swobodnego punktu widzenia (ang. Free Viewpoint Television - FTV) [6]. System ten pozwala na zmianę położenia punktu widzenia wokół oglądanej sceny, co daje widzowi wrażenie, jakby znajdował się w centrum akcji. Choć system oferuje niespotykane wcześniej możliwości, nadal jest on w fazie testów, gdzie pozostaje jeszcze wiele problemów do rozwiązania. Obecne rozwiązania FTV opierają się na rozmieszczaniu kilku lub kilkunastu kamer wokół pewnej sceny. Problemem są przede wszystkim gabaryty kamer. Stosowane są duże kamery telewizyjne, które wraz ze sprzętem pomocniczym sprawiają, że system nie jest mobilny - zmiana nagrywanego otoczenia wiąże się z długim czasem przenoszenia sprzętu i ustawienia go w nowym miejscu. Dodatkowo różnice w charakterystyce optycznej poszczególnych kamer wymagają przeprowadzenia kalibracji, co przekłada się na wysoki stopień skomplikowania systemu. Innym istotnym zagadnieniem jest dokładna synchronizacja wszystkich kamer w systemie, niezbędna do dalszego przetwarzania zarejestrowanych obrazów. 2. WIELOKAMEROWY SYSTEM REJESTRACJI OBRAZU Aby zapewnić rozwój telewizji swobodnego punktu widzenia należy wprowadzić kilka usprawnień. System powinien być możliwie prosty w konstrukcji, tani oraz mobilny. Taki właśnie system jest tematem omawianej pracy. Rys. 1. Schemat blokowy prostego systemu wielokamerowego DOI: 10.15199/59.2017.6.59 PRZEGLĄD TELEKOMUNIKACYJNY - ROCZNIK XC - WIADOMOŚCI TELEKOMUNIKACYJNE - ROCZNIK LXXXVI - nr 6/2017 413 Duża kamera telewizyjna została zastąpiona modułem kamerowym, skł[...]

Badania naukowe w zakresie technik multimedialnych


  DZIAŁALNOŚĆ BADAWCZA KATEDRY TELEKOMUNIKACJI MULTIMEDIALNEJ I MIKROELEKTRONIKI POLITECHNIKI POZNAŃS KIEJ (M. DOMAŃSKI) W zatrudniającej 14 nauczycieli akademickich Katedrze Telekomunikacji Multimedialnej i Mikroelektroniki Politechniki Poznańskiej działają dwie grupy badawcze: - Grupa Technik Multimedialnych kierowana przez prof. dra hab. inż. Marka Domańskiego, - Grupa Pola Elektromagnetycznego i Radioelektroniki kierowana przez prof. dra hab. inż. Wojciecha Bandurskiego. Działalności drugiej grupy dotyczy praca Modelowanie i symulacja propagacji fali EM w bezprzewodowych kanałach szerokopasmowych i połączeniach cyfrowych układów VLSI zamieszczona również w tym zeszycie. W niniejszym artykule zostanie omówiona działalność badawcza pierwszej grupy. Obejmuje ona: - przetwarzanie obrazów ruchomych i nieruchomych, - technikę obrazów stereoskopowych i trójwymiarowych, - kompresję obrazu, w tym kompresję obrazów trójwymiarowych, - telewizję swobodnego punktu widzenia, - analizę obrazów, zwłaszcza ruchomych, w tym rozpoznawanie i klasyfikację obiektów, analizę zdarzeń i zachowań, - technikę znaków wodnych w obrazach ruchomych, - przetwarzanie obrazów dla potrzeb telewizji cyfrowej, - implementację systemów w technice układów FPGA, - przetwarzanie i kompresję dźwięku, - technikę dźwięku przestrzennego. Badania dotyczące niektórych z wymienionych zagadnień zostaną omówione dalej. Ponadto w niniejszym zeszycie Przeglądu Telekomunikacyjnego i W iadomości Telekomunikacyjnych zamieszczono dwa inne artykuły dotyczące grupy badawczej kierowanej przez prof. M. Domańskiego: - Poznański kodek obrazu trójwymiarowego, - Telewizja swobodnego punktu widzenia, które w szczególny sposób omawiają dwa wybrane zagadnienia badawcze. W działalności badawczej Grupy Technik Multimedialnych szczególne znaczenie ma kompresja obrazów ruchomych. W tym obszarze zrealizowano najwięcej rozpraw doktorskich oraz projektów badawczych. Z nim związane były też poważne[...]

OPTYCZNY SKANER OBIEKTÓW TRÓJWYMIAROWYCH DOI:10.15199/59.2015.4.73


  W pracy przedstawiono technikę skanowania obiektów trójwymiarowych. Model 3D obiektu tworzony jest jedynie na podstawie analizy obrazów zarejestrowanych za pomocą zwykłej kamery (wideo). Zaproponowana technika wykorzystuje, opracowywany w ramach Międzynarodowej Organizacji Normalizacyjnej (ISO), algorytm estymacji głębi stereoskopowej z szeregu niezrektyfikowanych obrazów. Efektywność opracowanego rozwiązania sprawdzono na wielu obiektach testowych, zarejestrowanych za pomocą sensora Kinect. W celach porównawczych, poza obrazem obiektu, zarejestrowano również mapę głębi. Przedstawione wyniki eksperymentów potwierdzają możliwość zastąpienia urządzeń aktywnych do tworzenia trójwymiarowych modeli obiektów urządzeniami pasywnymi, wykorzystującymi techniki algorytmicznej estymacji map głębi jedynie na podstawie analizy zarejestrowanego obrazu. 1. WSTĘP Wraz z gwałtownym rozwojem dziedziny trójwymiarowej grafiki komputerowej, filmowych efektów specjalnych, przemysłu gier komputerowych oraz wchodzących na rynek drukarek 3D, można zaobserwować rosnące zainteresowanie rozwiązaniami pozwalającymi na szybkie i dokładne tworzenie modeli 3D fizycznych przedmiotów. Ręczne tworzenie modeli jest bardzo czasochłonne i wymaga specyficznych umiejętności oraz pewnej dozy talentu. Z kolei automatyczne techniki tworzenia modeli 3D, zwane skanerami 3D, wymagają specjalistycznego sprzętu. Na rynku są już dostępne różne systemy skanowania obiektów trójwymiarowych (3D), spośród których warto wymienić: kamery głębi [1], skanery wykorzystujące światło strukturalne w zakresie widzialnym lub w podczerwieni [2] oraz laserowe skanery obiektów. Jednak techniki te albo są bardzo drogie albo wytworzone z ich wykorzystaniem modele są niskiej rozdzielczości i jakości. W takich okolicznościach, prosta i tania technika automatycznego tworzenia modeli przestrzennych wydaje się być wielce pożądana. Co więcej, gdyby takie modele udało się stworzyć, wykorzystuj[...]

WPŁYW ALGORYTMÓW DEMOZAIKOWANIA NA DOKŁADNOŚĆ KALIBRACJI SYSTEMÓW WIELOKAMEROWYCH DOI:10.15199/59.2017.6.74


  Systemy wielokamerowe są to systemy składające się ze zbioru kamer, które powinny być precyzyjnie zamontowane oraz dokładnie zsynchronizowane. Systemy takie umożliwiają nagrywanie sekwencji wizyjnych zawierających wiele widoków. Każdy z widoków stanowi sekwencję obrazów zmiennych w czasie. Systemy wielokamerowe stosuje się między innymi w telewizji swobodnego punktu widzenia, stereowizji czy dozorze wizyjnym. Mogą być stosowane także do tworzenia trójwymiarowych modeli obiektów, pomiaru odległości między obiektami lub wielkości przedmiotów. Telewizja swobodnego punktu widzenia (ang. Free viewpoint Television - FTV) [11] jest aktualnie rozwijanym rozwiązaniem, które w przyszłości może stać się konkurencją dla tradycyjnej telewizji. Tradycyjna telewizja oferuje widzowi tylko jeden punkt widzenia, wymuszony przez położenie kamer rejestrujących scenę i decyzje realizatora. Dzięki telewizji swobodnego punktu widzenia, widz dostaje możliwość wyboru dowolnego położenia kamery wirtualnej, ale nie tylko wybranej z dostępnego zbioru kamer. Może wybrać widok sceny, z dowolnego położenia pośredniego. Takie rozwiązanie może znacząco wpłynąć na widowiskowość wielu wydarzeń, między innymi spektakli teatralnych czy wydarzeń sportowych. W niniejszej pracy poruszono tematy związane z kalibracją systemów wielokamerowych oraz demozaikowaniem, gdyż są to dwa początkowe kroki, mające istotny wpływ na dalsze etapy przetwarzania obrazów w systemach wielokamerowych (rys. 1). Rys. 1. Schemat systemu FTV 2. WYBRANE ZAGADNIENIA SYSTEMÓW WIELOKAMEROWYCH 2.1. Kalibracja systemów wielokamerowych Chcąc pracować z systemami wielokamerowymi zawsze musimy dokonać kalibracji systemu (rys. 1) [6]. Niestety, kamery wyprodukowane w tym samym czasie, na jednej linii produkcyjnej, nawet z tej samej serii różnią się między sobą. Wynika to z wielu drobnych różnic, np. inne położenie matrycy względem układu optycznego kamery, czy niedoskonałości samego układu o[...]

NOWE MEDIA IMMERSYJNE DOI:10.15199/59.2018.6.55


  1. WSTĘP Nazwa nowego rodzaju mediów, zwanych immersyjnymi (lub wszechogarniającymi), pochodzi od łacińskiego czasownika immergere, co oznacza zanurzenie się lub zanurzenie w czymś. W przypadku mediów cyfrowych jest to termin określający zdolność systemu technicznego do całkowitego "wchłonięcia" użytkownika w przedstawioną rzeczywistość. Multimedia immersyjne [1] mogą być związane zarówno z treścią naturalną, jak i generowaną komputerowo. W pracy skoncentrujemy się na treści naturalnej, która zastała zarejestrowana za pomocą kamer, mikrofonów i ewentualnie jest uzupełniana danymi z czujników dodatkowych, takich jak kamery głębi. Immersja ma różne aspekty, związane ze sposobami przekonywania naszych ludzkich zmysłów, że jesteśmy obecni w przedstawionej treści. W tym artykule koncentrujemy się na tych aspektach, związanych tylko z wizją. Przykładami mediów immersyjnych są rzeczywistość wirtualna, rzeczywistość mieszana i rzeczywistości rozszerzona, które ostatnimi czasy są bardzo dynamicznie rozwijane. Obecnie najbardziej obiecującymi urządzeniami do prezentacji obrazu, który pozwala na całkowite wchłonięcie widza są gogle VR (ang. Head Mounted Display), umieszczane na głowie i wyświetlające obraz bezpośrednio na wyświetlaczach umieszczonych wprost przed oczami widza. W ostatnich latach obserwuje się ciągły rozwój tego typu urządzeń w różnych skalach: od prostych opartych na smartfonach (Google Cardboard [2]) po dedykowane urządzenia współpracujące z komputerami PC (np. Oculus Rift) [3]. Rozwój i popularyzacja urządzeń umożliwiających immersję przyśpieszyły rozwój rynku i zintensyfikowały prowadzone badania. Obecnie trwają prace nad wieloma technologiami związanymi z immersją, z których każdy prezentuje różne poziomy/zakresy zanurzenia widza w prezentowany świat (realizm). Niektóre są bardzo ograniczone, np. pozwalają użytkownikowi zmienić tylko kierunek widzenia [4,5], podczas gdy inne są bardzo zaawansowane, np. pozwa[...]

NOWA TECHNIKA OPTYMALIZACJI DZIAŁANIA KODERA HEVC DOI:10.15199/59.2016.6.15


  NEW OPTIMIZATION TECHNIQUE OF THE HEVC VIDEO ENCODER Streszczenie: W pracy przedstawiono nową metodą szybkiego wyboru trybu kodowania wewnątrzobrazowego INTRA w koderze standardu HEVC. Podstawą opracowanej metody jest szczegółowa wiedza o częstości wybierania przez koder poszczególnych trybów kodowania wewnątrzobrazowego, w zależności od żądanej prędkości bitowej, rozdzielczości obrazu oraz jakości zakodowanego obrazu. Realizacja programowa opracowanej metody pozwoliła na pokazanie, że można płynnie regulować stopień przyspieszenia kodera i efektywność kodowania za jego pomocą. Abstract: The paper presents a new method of fast coding mode decision in the HEVC INTRA video encoder. The basis of the method is a detailed knowledge about frequency of using of individual coding modes in the encoder depending on the desired bitrate, spatial resolution of images, and the quality of coded images. Experiments showed a possibility of controlling the level of computations in the encoder at the cost of efficiency of video encoding. Słowa kluczowe: HEVC, kompresja obrazu, optymalizacja kodera, szybki koder obrazu ruchomego. Keywords: HEVC, video compression, video encoder optimization, fast video encoder. 1. WSTĘP Obecnie, ponad 60% wszystkich danych jakie są przesyłane w sieciach teleinformatycznych stanowią dane, które reprezentują obrazy ruchome. Co więcej, udział tych danych w ogólnym ruchu telekomunikacyjnym ciągle się zwiększa. Z tego powodu, od wielu lat podejmowane są bardzo intensywne prace, których celem jest opracowywanie coraz bardziej wydajnych sposobów reprezentacji ruchomego obrazu. Prowadzone w tym kierunku badania zaowocowały w ostatnich trzech latach opracowaniem nowej, wysokowydajnej techniki kompresji ruchomego obrazu, znanej jako HEVC (ang. High Efficiency Video Coding) [11]. Technika ta została w roku 2013 ujęta w międzynarodowych normach organizacji standaryzujących ISO/IEC oraz ITU-T i - w stosunku do powszec[...]

SZYBKIE TRANSKODOWANIE STRUMIENI HEVC POPRZEZ ELIMINACJĘ SKWANTOWANYCH WSPÓŁCZYNNIKÓW TRANSFORMATY O WARTOŚCI JEDEN DOI:10.15199/59.2017.6.60


  Transmisja obrazów w sieciach teleinformatycznych wymagać może zastosowania ściśle określonej wartości prędkości bitowej dla zakodowanego strumienia danych, który te obrazy reprezentuje. Poszczególne systemy transmisji obrazów (np. systemy mobilne, systemy telewizji cyfrowej, transmisja w internecie), stawiają jednak odmienne wymagania na prędkość bitową przesyłanych danych. Koncepcyjnie najprostszym rozwiązaniem tego problemu jest wielokrotna kompresja obrazów dla różnej prędkości bitowej. Jednakże przechowywanie wszystkich strumieni bitowych wymaga ogromnych pamięci masowych, co jest istotnym problemem. Odmiennym podejściem jest przechowywanie jednego tylko strumienia źródłowego, i późniejsze transkodowania na żądanie (On-Demand Transcoding) tego strumienia do wymaganej przez widza prędkości bitowej. Takie podejście staje się coraz bardziej powszechne ze względu na małe wymagania na pamięć i wciąż rosnące zasoby obliczeniowe w chmurze. Rozwiązanie z transkodowaniem zakodowanych wcześniej obrazów wymaga jednak szybkich, i zapewniających wysoką jakość transkoderów obrazu. 2. ANALIZA TRANSKODOWANIA HEVC Klasyczny transkoder obrazów jest prostym, szeregowym zestawieniem dekodera obrazów, który dokonuje dekompresji zakodowanego wcześniej strumienia, oraz kodera obrazów, który realizuje ponowną kompresję obrazów uwzględniając wymagania nałożone na parametry zakodowanego strumienia danych (np. prędkość bitowa nowego strumienia). Jednak stosowane w klasycznym transkoderze pełne kodowanie obrazów jest głównym powodem jego bardzo wysokiej obliczeniowej złożoności. Z perspektywy określonych zastosowań, np. działające na baterii systemy mobilne, ta wysoka złożoność jest ogromnym problemem. Z tego powodu powstają nowe projekty transkoderów, dzięki którym udaje się tę wysoką złożoność istotnie zmniejszyć. Cel ten osiąga się pomijając pewne kroki dekodowania zakodowanego strumienia lub upraszczając sam koder, który dokonuje ponown[...]

PRZYSPIESZENIE ESTYMACJI RUCHU ORAZ WYBORU PODZIAŁU CU W KODERZE HEVC DOI:10.15199/59.2017.6.76


  Kodowanie sekwencji wizyjnych z użyciem kodera HEVC [2][9] jest czasochłonne [8]. Nieosiągalna dla wcześniejszych metod kodowania sekwencji wizyjnych efektywność kodowania okupiona jest wielokrotnym wydłużeniem czasu kodowania sekwencji, w porównaniu ze starszymi metodami. Jest to na tyle dotkliwe, że aby ułatwić rozpowszechnienie techniki HEVC, konieczne jest przyspieszenie procesu kodowania. W ostatnich dwóch latach, w związku z wprowadzeniem techniki HEVC, problem przyspieszenia kodowania jest niezwykle silnie eksploatowanym polem badań naukowych i obszarem licznych wdrożeń opracowanych metod. Najważniejszym celem, stawianym przez badaczy, jest uzyskanie wyraźnego zmniejszenia złożoności obliczeniowej procesu kodowania międzyobrazowego, w tym sposobu wyznaczania wektorów ruchu oraz sposobu wyboru podziału bloków kodowania. Problem redukcji złożoności obliczeniowej procesu estymacji ruchu dotyczył również wcześniejszych technik, a opracowane dla nich metody, jak choćby te opisane w [3] są odpowiednio adaptowane i stosowane również w koderze nowej techniki HEVC, czyli w oprogramowaniu HM [7]. W artykule [6] i wcześniejszym [5], opisana została metoda wyznaczania podziałów bloków kodowania na podstawie złożonej analizy statystycznej. Dane statystyczne potrzebne do prawidłowego działania tej metody wymagają jednak fazy treningowej dla każdej sekwencji. Autorzy pokazują, że ich metoda daje do 60% przyspieszenia procesu kodowania przy nieznacznym wzroście prędkości bitowej generowanego strumienia. W artykule [11] autorzy prezentują metodę przyspieszenia procesu wyboru sposobu kodowania bloków obrazu z wykorzystaniem statystycznych zależności dotyczących sąsiednich bloków, dla których wybrany już został sposób kodowania. Metoda pozwala na zakończenie procesu podziału bloku w momencie uzyskania odpowiednio niskiej wartości funkcji kosztu, uwzględniając funkcje kosztu dla sąsiednich zakodowanych bloków. Przyspieszenie uzyski[...]

STEROWANIE KODEREM HEVC WYKORZYSTUJĄCE USUWANIE SZUMÓW DOI:10.15199/59.2017.6.77


  Postęp w rozwoju technik kompresji pozwala coraz bardziej efektywnie reprezentować obraz ruchomy. Najnowszą metodą kodowania opisaną w normach ISO/IEC oraz ITU jest technika HEVC [8]. Względem poprzedniej techniki AVC, HEVC pozwala uzyskać około 50% redukcję strumienia przy zachowaniu tej samej jakości [6]. Tak duży wzrost efektywności wynika ze znacznego rozwoju narzędzi kompresji dostępnym dla kodera. Przykładowo, wyliczyć można [3], iż dla jednostki kodowania LCU (Largest Coding Unit) koder HEVC ma do wyboru około 48 ∙ 1018 różnych kombinacji podziałów CU, TU, PU, 33 kierunki predykcji intra, oraz dwie listy referencyjne ze zmiennymi obrazami w predykcji inter. Z tego względu wybór trybów podczas kodowania jest jeszcze bardziej złożony niż w przypadku wcześniejszych technik, np. AVC. Wśród wszystkich dostępnych możliwości, koder poszukuje optymalnego zestawu trybów, które zmaksymalizowałyby stosunek jakośćprzepływność. Przejrzenie wszystkich możliwości w skali całego obrazu jest praktycznie niemożliwe i dlatego najczęściej wybór trybów optymalizuje się jedynie lokalnie na poziomie jednej jednostki LCU. Podejście takie jest zastosowane np. w oprogramowaniu modelowym HEVC grupy JCT-VC - HM [5]. Problem szybkiego wyboru trybów w jednostkach LCU kodera HEVC jest obecnie przedmiotem licznych prac naukowych (wyniki takich prac znaleźć można w publikacjach [9-26]), jednak prace te zakładają odmienny scenariusz kodowania obrazów w stosunku do tego który jest rozważany w tej pracy. Najszerszym zastosowaniem koderów wizyjnych jest kodowanie sekwencji naturalnych, rejestrowanych kamerami. Sekwencje takie charakteryzuje występowanie w nich szumu, w sposób nieunikniony powstającego w układach elektronicznych kamery. Szum jest w większości przypadków niepożądanym zakłóceniem, degradującym jakość sekwencji. Z kolei z perspektywy wyboru trybów, występowanie szumu w obrazie powoduje, że w danej jednostce CU wybierana jest taka[...]

Poznański kodek obrazów trójwymiarowych


  TECHNIKA OBRAZÓW TRÓJWYMIAROWYCH Obrazy stereoskopowe wykorzystuje się obecnie w wielu zastosowaniach. Przedmiotem badań naukowych są natomiast bardziej zaawansowane systemy obrazów trójwymiarowych drugiej generacji [1], które mają zapewniać widzom bardziej naturalną niż dotychczas percepcję obrazu przestrzennego. Na szczególną uwagę zasługuje obecnie szybko rozwijająca się technika monitorów autostereoskopowych, umożliwiających oglądanie obrazu stereoskopowego jednocześnie przez wielu widzów, którzy nie muszą w tym celu wykorzystywać żadnych specjalnych okularów. Monitor autostereoskopowy wyświetla jednocześnie wiele widoków tej samej sceny odpowiadających nieco innym punktom widzenia. Dla zapewnienia komfortu percepcji obrazu przestrzennego dużych rozmiarów monitor autostereoskopowy powinien wytwarzać dużą liczbę widoków. Obecnie produkowane monitory wytwarzają ich około 30, ale przewiduje się, że liczba ta zostanie zwiększona w przyszłych konstrukcjach. Dla pełnego wykorzystania swoich możliwości przyszłe monitory autostereoskopowe będą musiały otrzymywać reprezentację obrazu, która będzie bardziej bogata w stosunku do obecnie powszechnie wykorzystywanych par stereoskopowych. Dostarczania bogatszej reprezentacji obrazu przestrzennego będą wymagały także systemy, w których widz będzie mógł dostosowywać do swoich preferencji odległość bazową oglądanych obrazów stereoskopowych. Biorąc pod uwagę między innymi wspomniane zastosowania, przewiduje się, że w niedalekiej przyszłości - wraz z pewną liczbą widoków sceny - będą także przesyłane mapy głębi, w których wartości próbek reprezentują odległości do poszczególnych punktów obiektów sceny. Dla obrazów ruchomych mapy głębi oczywiście też są ruchome i zazwyczaj częstotliwość map głębi odpowiada częstotliwości obrazów. Z analizy różnych możliwych zastosowań wyłonił się prawdopodobny scenariusz przesyłania obrazów trójwymiarowych, dla których często stosowanym formatem będzie fo[...]

 Strona 1