### Singular Subspace Techniques for Image Analysis DOI:10.15199/59.2015.6.9

The 45-th anniversary of the Institute of Radioelectronics in Warsaw University of Technology is a unique opportunity to select my research results of basic scientific character, emphasize their role for multimedia applications, and present if possible the substantial part of them from a unified point of view. Having this goal in mind I have reviewed the list of my publications and observed that many of them directly or indirectly refer to compact and discriminative representation of multimedia data using singular subspace concept. Moreover, the works related to image energy distribution were published evenly in the whole, 18 years long, period of my stay within the Faculty of Electronics and Information Technology. Singular subspace concept is one of the fundamental ideas of multidimensional signal analysis. It can be defined, discussed, and applied within various mathematical formalisms like probabilistic models or energy models for image signal series. For this brief paper the energy approach is preferred for its more intuitive appeal. SINGULAR SUBS PACE of SIGNAL SERIES Suppose we have a finite series of L signal data vectors X = [x1,x1, ..., xL] where represents an image, a block of image, or any real valued vector of the fixed components. We can identify such signal series by a matrix x Î RNxL. The energy of the series can be measured by the squared Frobenius norm of X : || ||2 . F X Let the subspace be spanned by all linear combinations of columns in X be denoted by span(X). Its dimension is known as the rank r of matrix X : r = rank(X). Having any subspace S of span(X), we can project the signal series X orthogonally onto the subspace S - getting the series XS and its error series Es.Then the energy of X can be decomposed into two parts:The subspace Sk of dimension k < rank(X) which maximizes the energy of the projected signal Xs[...]

### Detekcja kopii obrazu metodą cech lokalnych

We współczesnych systemach i aplikacjach sieciowych coraz większą rolę odgrywają dane audiowizualne. W ogólnodostępnych sieciach komputerowych zgromadzono ogromną liczbę obrazów, fotografii czy klipów wideo, które są udostępniane i rozpowszechniane zarówno przez profesjonalnych dostawców treści multimedialnych jak i przez prywatnych użytkowników. Dane wizualne są często kopiowane oraz modyfikowane podczas rozpowszechniania po to, aby spełnić różnorodne wymagania dotyczące przepustowości sieci, zajętości zasobów dyskowych, jakości wizualnej, czy możliwości odtwarzania przez sprzęt użytkownika. Powszechnie stosowane urządzenia multimedialne oraz zasoby sieciowe wymagają danych multimedialnych w różnych formatach, z różną rozdzielczością obrazu, czy prędkością bitową przesyłu. W [...]

### W drodze do telewizji trójwymiarowej o swobodnym punkcie obserwacji

Koncepcja telewizji trójwymiarowej zakłada wywołanie u widza wrażenia trójwymiarowości. Takie doznanie można osiągnąć na wiele sposobów. Najbardziej znanym podejściem jest metoda stereowizyjna wykorzystująca właściwość wzrokowego systemu człowieka (Human Visual System). Innym podejściem jest ruch obserwatora względem przedmiotu obserwacji. W pewnym sensie obie metody uzupełniają się gdyż, albo mamy dwie statyczne kamery, albo jedną, ale przemieszczającą się. W każdym z przypadków istnieje możliwość rekonstrukcji trójwymiarowej struktury analizowanej sceny - czyni to nasz HVS, ale też system komputerowego widzenia. System telewizji trójwymiarowej o dowolnym punkcie obserwacji (Free View Point 3D TeleVision) bazuje na ruchu. Lecz jaki ruch może wykonać oglądający telewizję? Otóż[...]

### KONWOLUCYJNE SIECI GŁĘBOKIE W PROGRAMIE NAUCZANIA TECHNIK MULTIMEDIALNYCH W ZAKŁADZIE TELEWIZJI POLITECHNIKI WARSZAWSKIEJ DOI:10.15199/59.2017.6.43

Techniki multimedialne od ponad 20 lat stały się nieodzownym elementem aplikacji projektowanych w systemach wytwarzania, gromadzenia i przesyłu sygnałów cyfrowych. To co leży w obszarze zainteresowań Instytutu Radioelektroniki i Technik Multimedialnych, z punktu widzenia badań naukowych i edukacji można scharakteryzować skrótem CREAMS, analizowanym w kontekście możliwych aplikacji tworzonych między innymi na telewizyjnych platformach cyfrowych: 1. Compression: kompresja obrazu i dźwięku. 2. Recognition: rozpoznawanie obiektów multimedialnych (MM) na potrzeby HCI (human computer interfaces). 3. Embedding: zanurzanie obiektów MM w innych obiektach MM na potrzeby podpisu wodnego i tajnej komunikacji. 4. Annotation: indeksowanie obiektów MM w celu ich inteligentnego wyszukiwania. 5. Modelling 3D: modelowanie 3D na bieżąco, na potrzeby HCI. 6. Security: szyfrowanie i podpis cyfrowy obiektu MM na potrzeby bezpiecznej archiwizacji i komunikacji. Zauważmy, że tak sformułowane zagadnienia nie odnoszą się wprost do aktualnej technologii i narzędzi, które są lub potencjalnie mogą być wykorzystywane do ich rozwiązywania Niektóre z zagadnień CREAMS takie jak kompresja, czy bezpieczeństwo danych były i są przedmiotem intensywnych prac normalizacyjnych i doczekały się szeregu popularnych norm technicznych. Wszędzie tam, gdzie potrzebna jest wygodna wymiana informacji multimedialnej powstały efektywne formaty danych. Na większe zainteresowanie gremiów normalizacyjnych oczekują znaki wodne i steganografia cyfrowa. Inne zagadnienia jak rozpoznawanie, indeksowania (adnotacja) i modelowanie 3D na potrzeby interfejsu człowiekmaszyna, pomimo licznych prób (np. MPEG-7) są mniej podatne na zabiegi normalizacyjne. Z roku na rok rośnie znacząco liczba doniesień naukowych o kolejnych sukcesach technik konwolucyjnych sieci neuronowych (CNN) w zagadnieniach CREAMS. Proponowane rozwiązania "neuronowe" coraz częściej przewyższają najlepsze dotą[...]

### Przegląd nowych metod kompresji obrazu wykorzystujących uczenie maszynowe ze szczególnym uwzględnieniem uczenia głębokiego DOI:10.15199/59.2018.6.60

1. WSTĘP Ilość generowanych danych rośnie w zawrotnym tempie. Wynika to z rosnącej liczby systemów informatycznych, aktywności użytkowników oraz zwiększania dostępności Internetu. Raczkujący dopiero Internet Rzeczy może w dużym stopniu przyczynić się do zwiększenia ilości generowania nowych danych. Oprócz kosztu związanego z przechowywaniem tych danych, dodatkowy koszt pojawia się gdy dane trzeba przesłać. Według CISCO ruch IP w roku 2016 wynosił 96 tys. PB miesięcznie [4]. Raport ten wykazuje, że oprócz ilości przesyłanych danych wzrasta również samo tempo tego wzrostu. Dużą część omawianego transferu stanowią obrazy (grafika rastrowa ale też materiał wideo), które są wszechobecne na stronach internetowych czy usługach udostępniających przestrzeń w chmurze, a które w związku z rozwojem matryc wyświetlaczy (pośrednio) jak i rozwojem sensorów w aparatach i kamerach cyfrowych (bezpośrednio) zajmują coraz więcej przestrzeni dyskowej. Aby ograniczyć koszty związane z przechowywaniem i przesyłaniem danych oraz umożliwić wydajne funkcjonowanie systemów informatycznych stosowana jest kompresja. 2. KOMPRESJA Kompresja jest sposobem zapisu informacji tak, aby zmniejszyć wielkość zbioru danych. Zazwyczaj osiągane jest to poprzez zmniejszenie redundancji w danych. W skutek takiej operacji otrzymywany jest ten sam (lub zbliżony) zestaw informacji jednak zapisany na mniejszej liczbie bitów. Operacja odwrotna nosi nazwę dekompresji. Zestaw informacji po dekompresji może być identyczny z początkowym, lub przybliżony. Ze względu na ten fakt metody kompresji dzielą się na metody stratne i bezstratne. Metody bezstratne zmieniają tylko zapis (kodowanie) informacji jednak nie zmieniają jej treści. Metody stratne uzyskują znacząco wyższy stopień kompresji ponieważ są w stanie wybiórczo "zapomnieć" te części informacji, których brak nie dyskwalifikuje ich dalszego użytkowania. Ostatnim krokiem stratnych algorytmów kompresji jest zazwyczaj[...]

### Analiza możliwości transkodowania strumienia MPEG-2 video do MPEG-4 AVC/H.264 w dziedzinie współczynników transformaty

Transkodowanie jest procesem polegającym na konwersji wejściowego strumienia wideo zakodowanego z określonym zestawem parametrów na wyjściowy strumień, zakodowany z innym zestawem parametrów [1,2]. W typowych zastosowaniach transkodowanie ma na celu np. zmniejszenie przepływności bitowej, zmniejszenie rozdzielczości przestrzennej, redukcję częstotliwości powtarzania ramek. Z praktycznego punktu widzenia szczególnie istotne jest zagadnienie transkodowania sekwencji wizyjnych, zakodowanych w standardzie MPEG-2 Video [3] na standard MPEG-4 AVC/H.264 [4]. Dzięki bardziej efektywnym technikom kompresji zastosowanym w standardzie MPEG-4 AVC/H.264 w wyniku takiego transkodowania możliwie jest znaczne zmniejszenie przepływności bitowej przy zachowaniu jakości wejściowego strumienia wi[...]

### Koncepcja interdyscyplinarnego programu nauczania multimediów na poziomie magisterskim - projekt norweski DOI:10.15199/59.2016.6.2

Omówiono interdyscyplinarny program nauczania multimediów w języku angielskim. Program ten wraz z szeregiem skryptów (w większości internetowych w formacie TW5) powstał w ramach dwuletniego projektu norweskiego, którego opracowanie zakończono w lutym 2016 roku. Realizowany był przez trzy uczelnie warszawskie: Politechnikę, Uniwersytet Muzyczny Fryderyka Chopina i Akademię Sztuk Pięknych. Przedstawiono tutaj szczegóły przyjętej metodologii projektowej, której realizacja wspierana była niestandardowymi narzędziami informatycznymi. Na przykładach pokazano drogę od opisu projektów do kompletnego sylabusa wygenerowanego automatycznie w formacie PDF. Słowa kluczowe: multimedia w sztuce i inżynierii, projektowanie programu nauczania, podejście projektowe w edukacji * Politechnika Warszawska, Instytut Radioelektroniki i Technik Multimedialnych ** Uniwersytet Muzyczny im. Fryderyka Chopina, Katedra Reżyserii Dźwięku, e-mail: w.skarbek@ire.pw.edu.pl Motywacje, jakie kierowały zespołem, gdy decydowano się zgłosić wniosek grantowy dotyczący przygotowania programu nauczania multimediów i związanych z nim nowoczesnych skryptów akademickich, a więc projektu edukacyjnego z pogranicza inżynierii i sztuki, były wielorakie. Na czoło wybija się dynamiczny rozwój przemysłu kreatywnego (creative industry) na całym świecie. Nowe media, oparte na aplikacjach multimedialnych, wprowadziły nową jakość do sztuki i same stymulowały rozwój technologii w tym obszarze. Jest to w sensie cybernetycznym układ z dodatnim sprzężeniem zwrotnym, który zmienia formy kreacji sztuki, a także jej odbioru. Wystarczy wspomnieć ostatni boom na aplikacje dookólnej imersji 3D, gdy od roku 2014 dokonuje się rewolucja nie tylko w softwarze, ale też w hardwarze projektowanym dla takich aplikacji. Jesteśmy więc w trakcie głębokich zmian, które wpłyną na kształtowanie się rynku pracy dla absolwentów o profilu wykształcenia definiowanym w sylabusie. Powstają i będą powstawały [...]

### Kierunki rozwoju sieci telewizjii kablowej

Współczesne hybrydowe sieci HFC (Hybryd Fiber - Coax), będące platformami zarządzanymi przez operatorów telewizji kablowej, mają szansę stać się idealnym rozwiązaniem dla zwiększania maksymalnych przepływności bitowych w transmisji do abonentów. Nadal jednak wymaga rozwiązania wiele kwestii związanych z możliwościami wykorzystania pełnego potencjału sieci HFC, wynoszącego ok. 5Gbit/s (zakres[...]

