Wyniki 1-10 spośród 18 dla zapytania: authorDesc:"Julian Balcerek"

Multimodalna baza danych do celów identyfikacji osób - model i zastosowania

Czytaj za darmo! »

Procedury identyfikacji mówcy na podstawie głosu są rozwijane i testowane na tzw. korpusach. Korpus definiowany jest jako zbiór nagrań wypowiedzi dobranych i opisanych dla określonych aplikacji [1]. Istnieje wiele korpusów na potrzeby identyfikacji mówcy, zróżnicowanych pod względem języka, populacji mówców, rodzaju wypowiedzi (spontaniczna, czytana, sterowana/kierunkowana tematycznie), zawa[...]

Stereowizyjne metody tworzenia wrażeń trójwymiarowych z obrazów dwuwymiarowych

Czytaj za darmo! »

Różnice między polami widzenia oka lewego i prawego (rozstaw oczu ludzkich to ok. 65 mm), tj. między dwoma dwuwymiarowymi, płaskimi obrazami (w skrócie 2D od ang. Two Dimensional), obserwowanymi równocześnie lecz osobno przez lewe i przez prawe oko są interpretowane wmózgu w taki sposób, że powstaje wrażenie sceny trójwymiarowej (w skrócie 3D od ang. Three Dimensional), tzn. zbioru obiektów postrzeganych - zgodnie z rzeczywistą sytuacją - w różnych odległościach od obserwatora [1]. Określa się je mianem wrażenia stereowizyjnego (ang. Stereovision Impression) [2]. Interesującą cechą ludzkiej percepcji trójwymiarowości sceny jest to, że pomimo niektórych niekompletnych, a nawet, w pewnym zakresie, niespójnych informacji, jest możliwe uzyskanie wrażenia 3D. Dla przykładu, przy uż[...]

Powiększanie zakresu dynamicznego zdjęć zapisanych w formacie RAW


  Współczesne urządzenia do cyfrowej rejestracji i wyświetlania obrazów nie odwzorowują całego zakresu dynamicznego ludzkiego wzroku. Dlatego na zdjęciach o zróżnicowanych poziomach jasności (np. zawierających fragmenty zacienione i fragmenty nasłonecznione) obiekty zacienione są niedoświetlone i w konsekwencji są widoczne na zdjęciu jako czarne lub prawie czarne obszary z niewielką ilością szczegółów, a obiekty nasłonecznione są prześwietlone i dlatego są widoczne na zdjęciu jako obszary białe lub prawie białe, także z niewielką ilością szczegółów. Wskutek tego otrzymuje się zdjęcie niskiej jakości. Problem ten jest szczególnie istotny w przypadku zdjęć wykonywanych z lampą błyskową skierowaną wprost na fotografowany obiekt. Wówczas pierwszy plan jest znacznie prześwietlony, a [...]

Metoda poprawy czytelności obrazów z monitoringu CCTV


  W celu nadzorowania i zwiększania bezpieczeństwa określonych miejsc stosuje się system rejestrowania i przekazywania obrazu zwany telewizją przemysłową (CCTV, od ang. Closed- Circuit Television, dosł. telewizja w zamkniętym obwodzie) lub popularnie monitoringiem wideo. Niedostateczna jasność, niski kontrast (zwłaszcza w niesprzyjających warunkach pogodowych, o świcie i o zmierzchu), spore zaszumienie i słaba dynamika obrazu, a także zmęczenie osoby obsługującej stanowisko monitoringu są motywacją do niniejszej pracy, poświęconej opracowaniu prostej techniki poprawy jakości i czytelności obrazu, która nadaje się do realizacji w czasie rzeczywistym. W oparciu o informacje o kodowaniu wideo przy użyciu standardu MPEG oraz o lokalne cechy przestrzenne, włączając estymację ruchu i detekcję zmiany sceny, zdefiniowany został algorytm UME (ang. Usefulness Metric Of Enhancement, pol. użyteczna metryka wzmocnienia). Algorytm UME zastosowany w systemie wzmacniania ostrości wideo w dziedzinie przestrzennej został przedstawiony w [1]. Korekcja ekspozycji i zwiększanie kontrastu w celu poprawy jakości obrazu dla wideokonferencji zostały opisane w [2]. Rozwiązanie to jest oparte na budowie modelu Gaussa, detekcji obszarów ludzkich twarzy i informacji o szarości w obszarach twarzy. Technika oparta na uczeniu w celu poprawy postrzeganej jakości obrazu przy użyciu zwiększania jasności i zmian tonacji kolorów dla wideokonferencji została opisana w [3]. Nauczane są statystyki kolorów ze zbioru treningowego obrazów i ustawiane kolory obrazu wejściowego tak, żeby statystyki jego kolorów dopasować do zbioru treningowego. Technika usuwania szumu ze zdjęć C[...]

Zastosowanie stereowizji we wspomaganiu operatorów monitoringu wizyjnego DOI:10.15199/ELE-2014-001


  Wśród zagrożeń występujących we współczesnym środowisku zurbanizowanym rozróżniamy katastrofy naturalne, wypadki i popełniane przestępstwa. Na przestrzeni wielu lat ludzie wypracowali metody przeciwdziałania zagrożeniom. Techniczne metody są oparte na obserwacji, wykrywaniu i, w miarę możliwości, na eliminacji lub ograniczeniu skutków występowania zagrożeń. Jednym ze sposobów obserwacji są systemy monitoringu wizyjnego. Obsługa systemu monitoringu nastręcza jednak wielu problemów. Długotrwałe oglądanie obrazu przez operatora jest monotonne i nużące. W związku z tym po pewnym czasie słabnie uwaga i koncentracja operatora. W ostatnich latach są rozwijane techniczne możliwości wspomagania obsługi systemu monitoringu wizyjnego, odnoszące się do obserwowanych osób i obiektów. Osoby mogą być automatycznie wykrywane, śledzone i liczone [1]. Rozpoznawane są twarze, płeć i sposób chodu [2]. Wykrywane jest przekraczanie linii na dworcach kolejowych, przechodzenie na czerwonym świetle, czy też pozostawianie bagaży przez podróżnych [1, 3]. Dym i ogień również mogą być wykrywane [3]. Istnieją metody do automatycznego wykrywania, rozpoznawania, śledzenia i zliczania pojazdów oraz do wykrywania zatorów drogowych [4, 5]. Zabronione manewry wykonywane przez kierujących pojazdami, takie jak: parkowanie i skręcanie w niedozwolonych miejscach lub jazda w niewłaściwym kierunku na drogach jednokierunkowych również są wykrywane [3]. Numery tablic rejestracyjnych mogą być automatycznie odczytywane, a kolizje i wypadki drogowe wykrywane [6, 7]. Techniczne możliwości wspomagania operatorów monitoringu wideo poprawiają wydajność w przypadku średnio skomplikowanych zadań. Jednak dowiedziono, że operator, który jest skupiony na prostym zadaniu, ma nawet lepszą wydajność, kiedy nie korzysta z systemów do automatycznej analizy sygnału wideo [8]. Jednym z głównych wymogów stawianych operatorowi monitoringu wizyjnego jest zdolność utrzymywania koncentracji[...]

Iteracyjna metoda usuwania szumu impulsowego z obrazów cyfrowych DOI:10.15199/ELE-2014-004


  Podczas rejestracji obrazów z wykorzystaniem kamer i aparatów cyfrowych dochodzi do przekłamań wartości niektórych pikseli. Przekłamania te są widoczne jako zmniejszenie szczegółowości drobnych detali obrazu bądź jako niejednolity kolor na gładkich powierzchniach. Zapis oraz transmisja obrazów są także źródłem zmiany wartości poszczególnych pikseli. Takie przypadkowo zmienione piksele, określane jako szum impulsowy o zmiennych wartościach, są bardzo zauważalne dla ludzkiego oka [1, 2]. Do usuwania szumu impulsowego stosuje się wiele metod. Do najpopularniejszych należy filtracja medianowa, która skutecznie usuwa taki rodzaj szumu z gładkich powierzchni. Niestety, fragmenty o dużej szczegółowości, takie jak tekstury czy krawędzie, ulegają rozmyciu. W celu redukcji tego efektu zaproponowano filtry CWM (center weighted median filter) [3] oraz SWM (softswitching median filter) [4]. W ostatnich latach pojawiło się wiele zmodyfikowanych i udoskonalonych filtrów działających w oparciu o medianę. Do najistotniejszych można zaliczyć: peak-and-valley filter (PV) [5], extremum and median filter (EM) [6], minimummaximum exclusive mean filter (MMEM) [6] oraz pre-scanned minmax center-weighted filter (PMCW) [7] i decision-based median filters [8]. W artykule zaproponowano prosty i efektywny algorytm do wykrywania i usuwania szumu impulsowego wykorzystujący maskę o wymiarach 3×3 piksele. Wykrycie pikseli szumowych odbywa się w oparciu o dynamicznie dobierany próg detekcji, a odszumianie wykorzystuje filtrację medianową i uśrednianie. W dalszej części artykułu opisano sposób ustalania progu detekcji pikseli zaszumionych oraz metodę odszumiania pikseli uznanych za zaszumione. Rozdział "Przebieg i wyniki eksperymentów" prezentuje przeprowadzone eksperymenty oraz uzyskane wyniki odszumiania dla standardowych obrazów testowych wyrażone w decybelach, przykładowe odszumione obrazy oraz porównanie uzyskanych wyników z innymi, dostępnymi w literatu[...]

Fast 2D to 3D image conversion based on reduced number of controlling parameters DOI:10.12915/pe.2014.12.03

Czytaj za darmo! »

In this paper a new approach to fast 2D to 3D image conversion based on the reduced number of individually adjusted controlling parameters and simplified depth maps is presented. With the reported experiments conducted among viewers, five simple 2D to 3D conversion schemes were examined and compared. The results of the first experiment indicate a linear dependence between the controlling parameters among the examined viewers. In the second experiment, for the assumed linear dependence between the parameters, obtained in the first experiment but for another test image, a clear 3D effect perception was confirmed. Streszczenie. W artykule zaprezentowano nowe ujęcie problemu szybkiej konwersji obrazów dwuwymiarowych (2D) do trójwymiarowych (3D) oparte na zredukowanej liczbie indywidualnie dobieranych parametrów kontrolnych i uproszczonych mapach głębokości. W eksperymentach przebadano i porównano 5 prostych schematów konwersji, których parametry były ustawiane przez widzów. Wynik pierwszego eksperymentu wskazuje na liniową zależność pomiędzy tymi parametrami w populacji badanych osób. W drugim eksperymencie, dla założonej, uzyskanej w pierwszym eksperymencie liniowej zależności pomiędzy parametrami, ale dla innego obrazu testowego, potwierdzono postrzeganie wyraźnego efektu 3D. (Szybka konwersja obrazów 2D do 3D oparta na zredukowanej liczbie parametrów kontrolnych). Keywords: stereovision impressions, 2D to 3D conversion, anaglyph, depth map, image processing. Słowa kluczowe: efekty stereowizyjne, konwersja 2D do 3D, anaglif, mapa głębokości, przetwarzanie obrazów. doi:10.12915/pe.2014.12.03 Introduction Presently, most of images and sequences of images are still recorded using two-dimensional (2D) techniques, i.e., with monocular devices. Professional stereovision or threedimensional (3D) cameras are rare and expensive thus are rather seldom used. In some situations it is even impossible to use stereo recording. An example is a special mo[...]

Automatyczne wykrywanie osób w nagraniach uzyskanych przy niedostatecznym oświetleniu DOI:10.15199/48.2015.09.26

Czytaj za darmo! »

Artykuł przedstawia system do detekcji osób na nagraniach pochodzących z monitoringu miejskiego na otwartej przestrzeni. Proponowany system został przetestowany w trudnych, nocnych warunkach oświetlenia. W celu polepszenia jakości zarejestrowanych sekwencji wideo zaproponowano algorytm lokalnej poprawy kontrastu. Dzięki niemu detekcja obiektów ruchomych za pomocą GMM (Gaussian mixture model) oraz analizy BLOB (binary large object) jest bardziej precyzyjna. Dodatkowo ruchome obiekty wykryte w obrazie binarnym są śledzone przy użyciu filtru Kalmana, co zwiększa skuteczność algorytmu wykrywającego osoby. W artykule omówiono również dobór parametrów programu oraz sposób akwizycji obrazów. Abstract. The article presents the issue related to the intelligent analysis of video sequences, which are obtained from the city monitoring. Analysis of people detection, who passed under the camera in the outdoor scenes, has been tested in low lighting conditions (during the night). In order to improve the quality of acquired video sequences, local contrast enhancement algorithm was used. Thanks to this, detection of moving objects with the use of the GMM (Gausian mixture model) and BLOB (binary large object) analysis is more precise. In addition, detected moving objects in the binary image are tracked with the use of Kalman filter, which increases the efficiency of people detection. Selection of algorithm parameters and video acquisition method were also discussed. (Automatic detection of people from the recordings obtained in low lighting conditions). Słowa kluczowe: CCTV, inteligentna analiza wideo, poprawa jakości obrazu, lokalna poprawa kontrastu, analiza BLOB, detekcja i śledzenie obiektów ruchomych. Keywords: CCTV, intelligent video analysis, improving image quality, local contrast enhancement, BLOB analysis, moving objects detection and tracking. Wprowadzenie Inteligentna analiza sekwencji wizyjnych staje się coraz bardziej popularna w systemach CC[...]

Efektywna metoda uzyskiwania obrazów HDR dla systemów CCTV DOI:10.15199/48.2016.09.27

Czytaj za darmo! »

W artykule zaproponowano metodę przetwarzania obrazów przeznaczoną dla systemów CCTV (ang. closed circuit television) nadzorowanych przez człowieka (operatora monitoringu). Proponowane rozwiązanie poprawia szczegółowość obrazu uzyskiwanego w trudnych warunkach oświetleniowych, szczególnie dla obszarów nierównomiernie oświetlonych po zmroku lub przy silnym nasłonecznieniu. Do przetwarzania wykorzystano pary obrazów niedoświetlonych i prześwietlonych pochodzące z kamer o typowych przetwornikach 8-bitowych oraz z jednokrotnym naświetleniem dla przetworników o większej rozdzielczości niż 8 bitów. Abstract. In this paper an image processing method designed for CCTV (closed circuit television) systems supervised by the man (typically the monitoring operator) is presented. The proposed method enhances details of image obtained in difficult lighting conditions, especially for areas unevenly illuminated at night or in strong sunlight. Images acquired using cameras with converters of 8-bit resolution (overexposed and underexposed frames) or more than 8-bit are processed. (An effective method of HDR images generation for CCTV systems). Słowa kluczowe: HDR, mapowanie tonalne, CCTV, przetwarzanie obrazów, poprawa jakości obrazów. Keywords: HDR, tone mapping, CCTV, image processing, image quality improvement. Wprowadzenie Systemy monitoringu wizyjnego CCTV (closed circuit television) są rozwijane w celu zapewnienia bezpieczeństwa ludzi, głównie w obszarach zurbanizowanych. Wykorzystywane w nich kamery charakteryzują się coraz lepszymi parametrami technicznymi, coraz mniejszymi szumami, dużą czułością i rozdzielczością, wciąż jednak występują problemy z jakością obrazu za dnia w przypadku dużych kontrastów oraz w nocy, gdy kamera jest oślepiana [1]. Problem ten dotyczy nie tylko monitoringu miejskiego, ale także wielu innych systemów wizyjnych np. wspomagania kierowców pojazdów, pojazdów autonomicznych, czy awioniki. Możliwym rozwiązaniem powyższy[...]

Zastosowanie sztucznej sieci neuronowej do klasyfikacji zgłoszeń alarmowych DOI:10.15199/13.2018.4.1


  Według raportu z funkcjonowania systemu powiadamiania ratunkowego z 2017 roku, w 17 Centrach Powiadamiania Ratunkowego (CPR) w Polsce zarejestrowano ok. 19 mln połączeń telefonicznych. W ponad 6,6 mln połączeń dzwoniący anulowali połączenie w ciągu kilku pierwszych sekund, a ok. 8,5 mln połączeń stanowiły zgłoszenia fałszywe, złośliwe lub niezasadne. Oznacza to, że jedynie około 21% połączeń było istotnych. Dodatkowo, w ciągu roku ich udział we wszystkich zgłoszeniach nie zmienił się znacząco [1]. Oznacza to, że operatorzy CPR (około 1,2 tys. osób) mają do obsłużenia tysiące nieistotnych rozmów. W konsekwencji, ich głównym zadaniem zamiast reagowania na zgłoszenia, staje się ich weryfikacja i selekcja tych, które wymagają interwencji i dyspozycji środków [2]. Informacje o istotnych zdarzeniach powinny być przekazywane przez operatorów do jednego lub więcej podmiotów spośród: Policji, Państwowej Straży Pożarnej, dysponentów zespołów ratownictwa medycznego i służb pomocniczych [1]. Operator ma możliwość m.in. identyfikacji numeru telefonu, lokalizacji jednostek ratowniczych na mapie i zapisu podstawowych informacji [3]. Jak wynika z raportu, w 22% rozmów nie było możliwe ustalenie lokalizacji osoby dzwoniącej. Nawet w przypadku jej ustalenia, precyzja była znacznie ograniczona. Lokalizacja osoby dzwoniącej z sieci stacjonarnej była wyznaczana na podstawie adresu instalacji. W przypadku telefonii komórkowej brany był pod uwagę unikalny identyfikator dla każdego sektora telefonu w sieci oraz czas dotarcia sygnału ze stacji bazowej do telefonu. Zakres dokładności tej metody mieścił się w przedziale od 100 m do 1 km. Niestety, w Polsce nie został rozwinięty bardziej precyzyjny system zaawansowanej lokalizacji mobilnej (AML, z ang. advanced mobile location), wspomagający poprzednią metodę danymi z nawigacji satelitarnej i z bezprzewodowych sieci komputerowych. Jeszcze dokładniejszy system, wymagający instalacji przez użytkownika [...]

 Strona 1  Następna strona »