Wyniki 1-2 spośród 2 dla zapytania: authorDesc:"JAN J. MULAWKA"

Wyznaczanie podzbioru atrybutów w procesie eksploracji danych

Czytaj za darmo! »

Selekcja atrybutów pełni istotną rolę w procesie odkrywania wiedzy. Jakość danych wykorzystywanych w algorytmach maszynowego uczenia się [1] (klasyfikacji oraz aproksymacji) ma duży wpływ na wynik ich działania. Wybieranie podzbioru atrybutów polega na usuwaniu tych, które nie mają znaczącego wpływu na budowany model oraz usuwaniu atrybutów redundantnych. Selekcja atrybutów jest w stanie znacząco poprawić jakość oraz szybkość działania algorytmów eksplorujących dane. Należy zauważyć, że chodzi tu o przyspieszenie nie tylko na etapie eksploracji danych, ale również po tym, jak wiedza ta zostanie zaimplementowana w systemie ekspertowym [2]. Wynika to stąd, że model o mniejszych rozmiarach może być szybciej przetwarzany. Eksploracja danych bez uprzedniej selekcji atrybutów może o[...]

Filtrowanie zbioru reguł generowanych z drzew decyzyjnych

Czytaj za darmo! »

Wsystemach sztucznej inteligencji baza wiedzy odgrywa kluczową rolę [1]. Jakość bazy wiedzy może być zwiększona dzięki filtracji zbioru reguł decyzyjnych z wykorzystaniem technik oceny jakości dla pojedynczych reguł. Zagadnienia poruszane w niniejszej pracy dotyczą filtrowania zbioru reguł uzyskanych na podstawie drzew decyzyjnych generowanych w środowisku R przez algorytm z pakietu rpart w poszukiwaniu najlepszego podzbioru z wykorzystaniem różnych technik oceny jakości. W szczególności w pracy rozważane są następujące kwestie: czy filtrowanie reguł podnosi jakość klasyfikacji, które techniki oceny jakości reguł sprawdzają się najlepiej, jaki wpływ na klasyfikację ma ilość odciętych reguł, kiedy opłaca się zastosować filtrację. Aby odpowiedzieć na powyższe pytania, przeprowa[...]

 Strona 1