Wyniki 1-3 spośród 3 dla zapytania: authorDesc:"Michał Bernat"

ANALIZA PORÓWNAWCZA WYBRANYCH METOD PRZETWARZANIA SYGNAŁU EKG I DETEKCJI ZAŁAMKÓW R W ŚRODOWISKU GRAFICZNYM DOI:10.15199/13.2019.1.4


  Współczesne systemy automatyzacji i informatyzacji pola walki zaczynają dotyczyć nie tylko środków bojowych ale również załóg i obsług wysoce specjalistycznego oprzyrządowania. W tym obszarze istotną rolę zaczynają odgrywać elektroniczne urządzenia medyczne i biomedyczne. Zaawansowane sensory i algorytmy mają nieprzerwanie monitorować wydolność i gotowość do dalszego prowadzenia działań żołnierzy wykonujących kluczowe operacje i działania. Bazowym sygnałem rejestrowanym, transmitowanym i analizowanym od czasu twórców elektrokardiografii w XIX wieku jest zapis elektrycznej akcji serca. Wyjściowa idea wykorzystania zapisu EKG w diagnostyce chorób pozostaje niezmienna, ewoluują natomiast narzędzia, które służą optymalizacji oraz stałej poprawie efektywności prowadzonej diagnostyki. W obszarze metod rejestracji sygnałów możemy wyróżnić rozwój związany z: ilością, umiejscowieniem i łączeniem odprowadzeń pomiarowych, precyzją zapisu przebiegów, nośnikami przechowującymi pozyskane sygnały orz alternatywnymi metodami pomiaru, np. bez użycia elektrod skórnych. Wcześnie zauważona możliwość transmisji elektrycznej postaci sygnału EKG nie przyciągała uwagi naukowców tak mocno jak sama rejestracja czy analiza. Niemniej, dostrzegano możliwość i potrzebę przesyłania takiej informacji. Prace w tym zakresie objęły transmisje wycinków rzeczywistego sygnału, bądź po usunięciu składowych nadmiarowych (tzw. redundantnych) ciągłą transmisje sygnału skompresowanego (w postaci istotnych parametrów, znaczników, przekształceń). Pierwotny postęp w zakresie analizy dotyczył precyzyjnego opisu istotnych z punktu widzenia diagnostyki elementów elektrokardiogramu. Na podstawie badań wyszczególniono niezaburzone - bazowe składowe cyklu pracy serca, a precyzyjnie opisane odchylenia pogrupowano w predykatory stanów chorobowych. Badania prowadzone tym torem pozwoliły zaproponować kryteria klasyfikacji elektrokardiogramów prawidłowych [...]

Parametryzacja sygnału mowy w algorytmach rozpoznawania mowy DOI:10.15199/13.2015.2.7


  Mowa jest najbardziej naturalnym sposobem komunikowania się ludzi. Wraz z postępem nauki i techniki zaczęto szukać sposobów technicznej analizy i syntezy tej zdolności człowieka. Zagadnienia automatycznego rozpoznawania mowy (ang. Automatic Speech Recognition, ASR) od wielu lat są obszarem badawczym wielu ośrodków naukowych na całym świecie [1, 2, 3]. Początkowo wszystkie prace dotyczące rozpoznawania mowy dotyczyły języków dominujących: angielski, chiński, hiszpański, francuski. W ostatnich latach coraz większym zainteresowaniem cieszą się zagadnienia związane z rozpoznawaniem mowy polskiej [4, 5, 6]. Pod pojęciem rozpoznawania mowy kryje się wiele różnych zagadnień [7]. Jeżeli interesuje nas zawartość semantyczna wypowiedzi mamy do czynienia z klasycznym rozpoznawaniem mowy. Czasem jednak przetwarzanie sygnału mowy jest dokonywane w celu identyfikacji lub weryfikacji mówcy (ang. Automatic Speaker Identification, Automatic Speaker Verification). Jeszcze innym podejściem do tematu jest automatyczne rozpoznawanie emocji mówcy na podstawie jego wypowiedzi (ang. Automatic Emotion Recognition). Na rysunku 1 przedstawiono schemat blokowy systemu rozpoznawania mowy dla wariantu gdy procesowi rozpoznawania podlegają izolowane słowa. W naszym przypadku zbiorem rozpoznawanych słów są cyfry. Mimo dużej zmienności sygnału mowy oraz różnych możliwych wariantów algorytmów automatycznego rozpoznawania mowy problem działania tych algorytmów sprowadza się do znalezienia najbardziej prawdopodobnej sekwencji słów lub pojedynczego słowa z określonego słownika. Aby móc określić to prawdopodobieństwo musimy dysponować odpowiednim modelem odniesienia - jest on często nazywany modelem akustycznym. W związku z powyższym w algorytmach automatycznego rozpoznawania mowy, jak to przedstawiono na rysunku 1, wydziela się etap wyznaczania modelu akustycznego, czyli modelu probabilistycznego danej frazy. Etap ten często nazywany jest etapem uczenia lub [...]

Szczegóły implementacyjne algorytmów do rozpoznawania mowy DOI:10.15199/13.2015.2.8


  Artykuł jest wynikiem prac nad poznaniem i testowaniem wybranych metod rozpoznawania mowy. Szczegółowy opis poruszonych zagadnień jest przygotowaniem do późniejszej implementacji wybranego algorytmu na platformie sprzętowej DSK OMAP L138. Pracę nad przygotowaniem do implementacji rozpoczęto od analizy dostępnych rozwiązań. Wśród szerokiej gamy najbardziej popularnych metod, wybrano metodę opartą na algorytmie modeli mikstur gaussowskich GMM [2] oraz ukrytych modelach Markowa HMM [3, 4]. Jako dane wejściowe, obie metody przyjmują sparametryzowany sygnał audio, metodami wyznaczającymi współczynniki mel-cepstralne MFCC oraz cepstralne współczynniki liniowej predykcji LPCC [1, 7]. W opracowanym dokumencie położono duży nacisk segmentację algorytmu na szereg modułów funkcjonalnych z których każdy ma zdefiniowany wymiar danych wejściowych oraz wyjściowych. Takie podejście ma kluczowe znaczenie przy późniejszej implementacji sprzętowej. W badaniach przyjęto zbiór dziesięcioelementowy w którym każdy element zbioru reprezentuje cyfrę mowy polskiej 0-9. Testy obu metod zostały wykonane dla rozłącznych zbiorów trenujących oraz testujących. Wyniki są zobrazowane na tych samych wykresach i porównane dla identycznych danych wejściowych. Wynikiem pracy jest wybór najbardziej odpowiedniej metody jako skutecznego narzędzia do rozpoznawania izolowanych fraz głosowych mowy polskiej. Model systemu Model systemu do rozpoznawania izolowanych fraz głosowych został podzielony na dwa główne moduły funkcyjne. Pierwszy z nich jest odpowiedzialny za wytrenowanie wzorca. Wynikiem działania tego modułu jest zwarta struktura danych, która reprezentuje każdy z elementów zbioru. Drugi moduł jest klasyfikatorem odpowiedzialnym za porównanie nagrania z wcześniej wytrenowanym wzorcem i sklasyfikowaniem go jako odpowiedniego elementu zbioru. Moduł trenowania wzorca Moduł trenowania wzorca został przedstawiony na rys. 1. Pierwszy blok modułu jest odpowiedzia[...]

 Strona 1