Wyniki 1-10 spośród 24 dla zapytania: authorDesc:"Andrzej P. Dobrowolski"

Klasyfikacja wzrokowych potencjałów wywołanych w oparciu o dekompozycję wielorozdzielczą i sieć SVM DOI:10.15199/13.2016.2.8


  W elektrofizjologicznym badaniu wzroku najczęściej wykorzystuje się wzrokowe potencjały wywołane, które charakteryzują się kolejno ułożonymi w funkcji czasu ekstremami, zwanymi falami lub załamkami. Morfologia przebiegu, a w szczególności zależności czasowe i amplitudowe poszczególnych fal, umożliwiają neurologowi postawienie diagnozy, co nie jest zadaniem prostym. Wymaga od neurologa doświadczenia, skupienia uwagi i bardzo dobrej percepcji. W celu wsparcia procesu diagnostycznego autor opracował algorytm realizujący zautomatyzowaną klasyfikację słuchowych potencjałów wywołanych do grupy przypadków patologicznych lub prawidłowych. Czułość metody w 100 osobowym zbiorze przypadków określono na 94%, przy 16% prawdopodobieństwie fałszywego alarmu, co z medycznego punktu widzenia jest wynikiem satysfakcjonującym. Słowa kluczowe: inżynieria biomedyczna, wzrokowe potencjały wywołane, dekompozycja falkowa, sieć wektorów nośnych.Przewodnictwo nerwowe odbywa się dzięki złożonym procesom elektrochemicznym, a każdemu przenoszonemu sygnałowi odpowiada tzw. potencjał czynnościowy, który można rejestrować stosując odpowiednie techniki elektroneurograficzne. Do celów diagnostycznych wykonuje się badania elektroencefalograficzne, które pozwalają na ocenę funkcjonowania dużych zespołów włókien nerwowych oraz wybranych ośrodków korowych mózgu [1]. Szczególnym rodzajem badań elektroencefalograficznych są badania tzw. potencjałów wywołanych (ang. evoked potentials). Badania te polegają na rejestracji napięcia pomiędzy elektrodami umieszczonymi w różnych punktach na powierzchni głowy, po zadziałaniu fizycznych bodźców drażniących receptory słuchowe, wzrokowe, czuciowe lub - znacznie rzadziej - węchowe. Badania obejmują rejestracje odpowiedzi od receptorów, poprzez poszczególne fragmenty traktu nerwowego, aż po ośrodki korowe mózgu. Niniejszy artykuł koncentruje się na wzrokowych potencjałach wywołanych WPW (ang. VEP - Visual Evoked Potentials), [...]

Ocena przydatności wybranych cech sygnału mowy w systemach automatycznego rozpoznawania mówcy

Czytaj za darmo! »

W prezentowanym referacie przedstawiono problematykę systemów automatycznego rozpoznawania mówców (ASR - ang. Automatic Speakers Recognition) wraz z ich szczegółową klasyfikacją. Ze względu na to, że etap ekstrakcji cech ma decydujące znaczenie przy ocenie skuteczności systemów niezależnych od tekstu, dokonano przeglądu wybranych cech sygnału mowy istotnych z punktu widzenia ich przydatności w zadaniach automatycznego rozpoznawania mówców. Ponadto w referacie zaprezentowano przykładowe widma dźwięcznej głoski " i" oraz dokonano oceny użyteczności reprezentacji częstotliwościowej sygnału mowy w automatycznych systemach rozpoznawania mówcy. Abstract. The paper presents the problem of automatic speakers recognition (ASR) systems together with their detailed classification. Due to the fact, that the stage of feature extraction is crucial in assessing the effectiveness of text-independent systems, it was reviewed of selected characteristics of the speech signal relevant to their suitability to the tasks of automatic speaker recognition. In addition, the paper presents examples of the spectrums of resonant vowel "i", and assesses the usefulness of the spectral representation of a speech signal for ASR systems. (Evaluation of the usefulness of selected features of the speech signal for automatic speaker recognition systems). Słowa kluczowe: rozpoznawanie mówców, sygnał mowy, ekstrakcja cech, systemy ASR. Keywords: speaker recognition, speech signal, feature extraction, ASR systems. Wprowadzenie Rozpoznawanie głosów należy do grupy biometrycznych metod identyfikacji osób. Inne techniki z tej samej grupy polegają m.in. na identyfikacji na podstawie odcisków palców, przebiegu naczyń krwionośnych dłoni, obrazu siatkówki oka, rysów twarzy czy struktury kodu DNA. Zaletą automatycznego rozpoznawania osób na podstawie indywidualnych charakterystyk głosu jest to, że atrybuty osobnicze nie mogą zostać zgubione (np. jak klucz) lub zapomniane (jak kod, c[...]

Application of homomorphic methods of speech signal processing in speakers recognition system

Czytaj za darmo! »

The paper presents the problem of automatic speaker recognition system. Automatic recognition of speaker is a process designed to determine, whether a particular statement belongs to the speaker. The speech signal is a carrier of both physiological and behavioral features. No two individuals sound identical, because their vocal tract shapes, larynx sizes, and other parts of their voice production organs are different. This paper contains a description of the speech signal analysis algorithms, designed based on normalized real cepstrum. The authors have attempted to select the optimal set of parameters describing the speaker. The study has primarily focused on assessing applicability of the cepstral analysis of speech signal. In addition results of experiments are presented using a PCA method. Streszczenie. W prezentowanym referacie poruszono problematykę systemu rozpoznawania mówcy. Automatyczne rozpoznawanie mówcy jest procesem mającym na celu określenie, czy dana wypowiedź należy do określonego mówcy. Sygnał mowy jest nośnikiem zarówno cech fizjologicznych, jak i behawioralnych. Nie ma dwóch identycznie brzmiących osób, ze względu na fakt występujących różnic w budowie krtani, głośni, traktu wokalnego oraz innych organów artykulacyjnych u każdego człowieka. Praca zawiera opis algorytmów analizy sygnału mowy opracowanych w oparciu o rzeczywiste cepstrum. Dzięki tej technice multiplikatywny związek pobudzenia i traktu głosowego zastąpiony zostaje związkiem addytywnym, co znacznie upraszcza separację obu składników. Autorzy podjęli się próby wyboru optymalnego zestawu cech charakteryzujących danego mówcę. Badania koncentrowały się przede wszystkim na ocenie użyteczności analizy cepstralnej sygnału mowy. Dodatkowo uzyskane wyniki eksperymentów przedstawiono przy pomocy metody PCA. (Zastosowanie homomorficznych metod przetwarzania sygnału mowy w systemach rozpoznawania mówcy) Keywords: speech signal, feature extraction, cepstral analysis. Słow[...]

Modeling and optimization of the feature generator for speaker recognition systems

Czytaj za darmo! »

This paper presents issues related to modeling and optimization of the feature generator for the speaker recognition system (ASR - Automatic Speakers Recognition). The parameterization stage of generating a speech signal (features generation) is fundamental in this type of system because the unique vector of features is crucial in the process of speech recognition. The task is to describe the speech signal using as few descriptors as possible without loss of relevant information for speaker recognition. In addition, the parameterization should be robust to acoustic and technical registration conditions and to the recorded linguistic material. The research presented in this paper focused primarily on the multicriteria optimization of selected parameters of the feature generator based on cepstral analysis that additionally enables the selection of features. Finally, the evaluation of the results was based on the analysis of the main components of a set of descriptors for the samples of voice acquired from 24 speakers. Streszczenie. W referacie przedstawiono zagadnienia związane z modelowaniem i optymalizacją generatora cech dla systemu automatycznego rozpoznawania mówcy (ang. Automatic Speaker Recognition - ASR). Etap generacji cech (parametryzacji sygnału mowy) jest fundamentalny w tego typu systemach, z uwagi na fakt, że unikatowy wektor cech ma decydujące znaczenie w procesie rozpoznawania. Zadaniem generatora cech jest opisanie sygnału mowy za pomocą możliwie mało licznego zbioru deskryptorów, bez utraty informacji istotnych z punktu widzenia rozpoznawania mówcy. Ponadto parametryzacja powinna wykazywać odporność na warunki akustyczne i techniczne rejestracji oraz na zawartość lingwistyczną rejestrowanego materiału. Badania przedstawione w referacie koncentrowały się przede wszystkim na wielokryterialnej optymalizacji wybranych parametrów generatora cech opartego na analizie cepstralnej, uwzgledniającej dodatkowo selekcję cech. Oceny otrzym[...]

Projekt systemu automatycznego rozpoznawania mówcy w oparciu o techniki homomorficzne


  Mowa jest naturalnym i jednym z najbardziej efektywnych sposobów komunikowania się ludzi z otoczeniem. Ogromna ilość informacji przekazywana przy pomocy tego naturalnego sygnału spowodowała, że już od wielu lat na świecie prowadzone są badania mające na celu odpowiednie przetworzenie sygnału mowy, w celu wydobycia informacji wymaganych dla konkretnych zastosowań. W niniejszym artykule przedstawiono proces projektowania systemu automatycznego rozpoznawania mówcy. Automatyczne rozpoznawanie mówcy zwane także automatycznym rozpoznawaniem głosów, jest procesem realizującym szereg reguł decyzyjnych na mierzalnych cechach sygnału mowy, mających na celu określenie czy dana wypowiedź należy do określonego mówcy zależnie lub niezależnie od treści wypowiedzi. System automatycznego rozpoznawania mówcy identyfikuje/ weryfikuje osobę, dzięki porównaniu tzw. wektora cech z bazą modeli głosów. Na rys. 1 przedstawiono przykładowy schemat takiego systemu. Analiza sygnału mowy, w wyniku której otrzymuje się wektor cech, niosący informację o indywidualnych właściwościach głosu mówcy, odbywa się w dwóch trybach: uczenia bądź identyfikacji (klasyfikacji) [2].W fazie uczenia nowi mówcy ze znanymi tożsamościami zapisywani są w bazie danych systemu. Faza identyfikacji, polega na porównaniu wyekstrahowanych unikatowych cech głosu nieznanego mówcy z próbkami zawartymi w bazie systemu (klasyfikacja). Zarówno w fazie uczenia jak i identyfikacji używane są te same algorytmy parametryzacji sygnału mowy wyznaczające unikatowy "odcisk głosu" (ang. Voice Print). Metodyka badań Pierwszym zadaniem autorów było zebranie materiału badawczego w postaci próbek sygnału mowy. Rejestracji czasowych przebiegów akustycznego sygnału mowy dokonano w Instytucie Systemów Elektronicznych Wydziału Elektroniki WAT z zastosowaniem mikrofonu dynamicznego Monacor DM-500, karty dźwiękowej komputera oraz oprogramowania Matlab. Podczas badania, odległość mikrofonu od ust osoby mó[...]

System automatycznego rozpoznawania mówcy z wykorzystaniem techniki cepstralnej i modeli mieszanin gaussowskich

Czytaj za darmo! »

W niniejszym artykule zaprezentowano zaimplementowany w środowisku Matlab system automatycznego rozpoznawania mówcy, wykorzystujący do opisu głosu unikatowy wektor cech, tzw. "odcisk głosu" (VP - ang. Voice Print). System używa w procesie klasyfikacji tzw. modele mieszanin Gaussowskich (GMM - ang. Gaussian Mixture Model). W końcowej części artykułu przedstawione są badania skuteczności rozpoznawania mówców dla różnych wariantów systemu oraz w różnych konfiguracjach jego parametrów. Abstract. The paper discusses the system of automatic speaker recognition, implemented in Matlab environment and using a unique vector of features, the so-called voice print (VP) for voice description. The system uses the so-called Gaussian Mixture Models (GMM) for the classification process. The final section of the paper presents the studies on the efficiency of speaker recognition for various system versions and for different system parameter configurations. (Automatic speaker recognition system using cepstral technique and Gaussian Mixture Models). Słowa kluczowe: rozpoznawanie mówców, sygnał mowy, ekstrakcja cech, Modele Mieszanin Gaussowskich. Keywords: speaker recognition, speech signal, feature extraction, Gaussian Mixture Models. Wstęp W dzisiejszych czasach potrzeba stosowania systemów automatycznego rozpoznawania mówcy ASR (ang. Automatic Speakers Recognition) staje się coraz większa. Powodem tego jest nieustanny wzrost poziomu interakcji między człowiekiem a komputerem. Dzięki coraz częstszemu stosowaniu technik biometrycznych w procesie autoryzacji w systemach wymagających wysokiego stopienia bezpieczeństwa, system ASR znajduje zastosowanie w branży zarówno wojskowej jak i cywilnej. Głos, jako jedna z unikatowych cech dystynktywnych każdego człowieka, pozwala na identyfikację osoby bez potrzeby posiadania dodatkowych atrybutów, które mogą ulec zniszczeniu lub zgubieniu. Stosunkowo łatwy dla człowieka proces rozpoznawania osób przy pomocy nar[...]

Projekt zestawu do adaptacyjnej redukcji zakłóceń w głosowym systemie identyfikacji osób

Czytaj za darmo! »

W artykule przedstawiono projekt zestawu do rejestracji dźwięków mowy zaimplementowanego w biometrycznym systemie identyfikacji osób. Zaprezentowano także problematykę związaną z torem dźwiękowym pomiędzy mówcą a systemem decyzyjnym, klasyfikację źródeł zakłóceń i zniekształceń towarzyszących procesowi rejestracji i obróbki dźwięku oraz klasyfikację metod i algorytmów poprawy jakości rejestrowanego sygnału mowy. Abstract. The paper presents the project of a specialized kit for adaptive method reduction speech sounds in biometric identification system. There are the voice path from the speaker’s mouth to the decision system, a classification of various sources of interferences and distortions connected with the sound recording, as well as classification of methods and algorithms for improvement of the voice quality described. (Project of a kit for adaptive noise reduction in voice system of persons identification) Słowa kluczowe: filtry cyfrowe, biometryczny system identyfikacji, odszumianie sygnału mowy. Keywords: digital filters, biometric identification system, speech denoising. Wstęp Biometria to obecnie dynamicznie rozwijająca się dziedzina nauki zajmująca się pomiarem indywidualnych cech człowieka, ze szczególnym uwzględnieniem atrybutów fizycznych i behawioralnych różnicujących poszczególne osoby. Każdy człowiek posiada pewne unikalne cechy fizyczne (anatomiczne), takie jak: np. geometrię kształtu twarzy, dłoni, linie papilarne, zapach, barwę głosu, tęczówkę oka, rozkład naczyń krwionośnych itp. oraz cechy behawioralne, takie jak: charakterystykę głosu, mowy, ruchu, pisma, chodu. Wszystkie te cechy umożliwiają w pewnym stopniu identyfikację, jednak im jest ich więcej, tym większa jest skuteczność prawidłowej weryfikacji. Jednym z elementów biometrycznych systemów identyfikacji osób jest rozpoznawanie osób na podstawie specyficznych cech ich mowy, uważane obecnie za jedną z najbezpieczniejszych i najłatwiejszych w masow[...]

Obiektywna ocena traktu słuchowego oparta na analizie falkowej potencjałów wywołanych i sieci wektorów nośnych

Czytaj za darmo! »

W artykule opisano problematykę związaną z elektroencefalograficznym badaniem słuchu. Ze względu na to, że obecne metody opierają się głównie na interpretacji przebiegów czasowych elektroencefalogramów i wymagają od badającego neurologa dużego doświadczenia, podjęto się zadania, które ma na celu eliminację subiektywnej oceny wyników oraz zautomatyzowanie badania. Autorzy korzystając z metod CPS wyodrębnili cechy dystynktywne potencjałów wywołanych dobrze różnicujące przypadki prawidłowe od patologicznych. Abstract. The paper describes the problems associated with electroencephalographic examination hearing. Due to the fact that the current methods are mainly based on the interpretation of the timing electroencephalograms and require a large experience of examining neurologist, it was a task that aims to eliminate the subjective evaluation of results, and test automation. The authors use the CPS methods have identified distinctive features of evoked potentials well differentiating normal form pathological cases. (Objective assessment of auditory pathway on the basis of evoked potentials wavelet analysis and support vector machine) Słowa kluczowe: słuchowe potencjały wywołane pnia mózgu, dekompozycja falkowa, sieć wektorów podtrzymujących Key words: auditory brainstem evoked potentials, wavelet decomposition, support vector machine Wstęp Metodą diagnozowania ludzkiego mózgu jest badanie elektroencefalograficzne (EEG). Pozwala ono na obserwację i rejestrację bioelektrycznych czynności mózgu. Dzięki elektroencefalografii można m.in. diagnozować wzrok i słuch oraz oceniać reakcje na różne bodźce aktywujące poszczególne obszary mózgu. Artykuł poświęcony jest diagnostyce neurologicznej opartej na analizie słuchowych potencjałach wywołanych - SPW (AEP - ang. Auditory Evoked Potentials) [1]. Autorzy wyjaśniają pojęcie potencjałów wywołanych, ich rolę w badaniu słuchu oraz przedstawiają dotychczasowe metody analizy. Najistotniejszym elementem [...]

Detektor upadków oparty na dyskretnej transformacie falkowej oraz niezależnych klasyfikatorach SVM


  Postęp medycyny oraz technologii przyczynił się do wzrostu średniej długości życia człowieka. Przesunięcie demograficzne w kierunku wyższej średniej długości życia, przyczynia się do zwiększenia odsetka ludzi starszych [1, 2]. Tzw. proces starzenia się społeczeństwa niesie za sobą szereg konsekwencji, które dotyczyć mogą między innym obszaru społecznego, psychologicznego, ekonomicznego oraz politycznego [3]. Z tego powodu bardzo ważne staje się zapewnienie właściwej opieki medycznej osobom najbardziej narażonym na problemy zdrowotne, tj. osobom w wieku powyżej 65 roku życia [3, 4]. Bardzo istotnym problemem tej grupy wiekowej są upadki, z którymi często związane są poważne konsekwencje. Skutkiem postępujących z wiekiem człowieka procesów fizjologicznych, charakteryzujących się zmianami w jego układzie nerwowym, jest spowolnienie procesów myślowych, spadek napięcia mięśniowego, zaburzania równowagi oraz spowolnienie reakcji obronnych [3]. W efekcie znacząco wzrasta ryzyko upadków, a w następstwie prawdopodobieństwo wystąpienia urazów. Należy w tym miejscu podkreślić, jak istotny problem stanowią upadki. Mianowicie około 33% społeczeństwa w wieku powyżej 65. roku życia narażone jest na upadek i odsetek ten wzrasta wraz z wiekiem [4, 5]. Dane z roku 2002 podają, że upadki doprowadziły do śmierci 391 tysięcy osób, a co czwarte zdarzenie miało miejsce w krajach o wysokich dochodach [4]. Ponad połowa zdarzeń upadków prowadzi do hospitalizacji i skutkuje ograniczeniem sprawności ruchowej człowieka lub zgonem [4, 6, 7, 8]. Dodatkowo upadek może skutkować wyzwoleniem zmian psychicznych w postaci lęków, depresji czy ograniczenia aktywności ruchowej [3]. W [9] zdefiniowano to jako syndrom poupadkowy. Bardzo szybka detekcja niekontrolowanego upadku człowieka pozwala na skrócenie czasu pomiędzy wystąpieniem upadku, a udzieleniem przez właściwe służby medyczne niezbędnej pomocy [10, 11]. Niniejszy artykuł jest kontynuacją prac zapoczątko[...]

Liniowa analiza dyskryminacyjna parametrów transformaty falkowej sygnałów PJR

Czytaj za darmo! »

W referacie przedstawiono nową metodę diagnostyczną opartą na analizie skalogramów wyznaczonych za pomocą falek Symlet 4. Z otrzymanych skalogramów wyekstrahowano 6 cech, które w wyniku analizy dyskryminacyjnej LDA zredukowano do 2. Problem dyskryminacji przypadków prawidłowych, miogennych i neurogennych sprowadzony do płaszczyzny okazał się liniowo separowalny. Implementacja programowa metody [...]

 Strona 1  Następna strona »