Wyniki 1-2 spośród 2 dla zapytania: authorDesc:"PIOTR SUCHOMSKI"

DOPASOWANIE CHARAKTERYSTYKI DYNAMIKI DŹWIĘKU DO PREFERENCJI SŁUCHOWYCH UŻYTKOWNIKA URZĄDZEŃ MOBILNYCH DOI:10.15199/59.2015.8-9.97


  W celu określenia preferowanej charakterystyki dynamiki generowanych dźwięków należy uzyskać informację, w jaki sposób użytkownik postrzega głośność dźwięków o różnym poziomie dźwięku. Poruszany problem należy rozpatrywać oddzielnie dla dwóch grup użytkowników - osób słyszących prawidłowo oraz osób z ubytkiem słuchu. W pierwszym przypadku należy zadbać o to, aby wyznaczona charakterystyka dynamiki właściwie przetwarzała dźwięki o poziomach ocenianych odpowiednio jako za ciche, komfortowe i za głośne. W przypadku drugiej grupy użytkowników należy wyznaczyć charakterystykę dynamiki, która pozwoli dopasować szeroką dynamikę odtwarzanych dźwięków do zawężonej dynamiki uszkodzonego słuchu. W obu przypadkach do oceny wrażenia głośności można wykorzystać odpowiednio dopasowany test skalowania głośności. W niniejszym referacie zaprezentowano metody określenia charakterystyki dynamiki dźwięku dla obu wymienionych grup użytkowników z wykorzystaniem zaproponowanej metody szybkiej oceny wrażenia głośności. 1. WSTĘP Urządzenia mobilne takie jak notebooki, ultrabooki, tablety czy smartfony wykorzystywane są obecnie zarówno do pracy, jak również do użytku osobistego, np. do słuchania muzyki. Niezależnie od sposobu użycia tych urządzeń, ważnym aspektem jest jakość dźwięku. Niestety ograniczenia konstrukcji tego typu urządzeń wpływają negatywnie na jakość generowanego przez te urządzenia dźwięku, dotyczy to głównie wielkości głośników, ich jakości, pasma przenoszenia, itd. Dlatego oczekiwania użytkowników w kwestii poprawy jakości dźwięku odtwarzanego przez urządzenia mobilne ciągle rosną. Jednym z aspektów szeroko rozumianej poprawy jakości dźwięku w urządzeniach mobilnych jest dopasowanie dynamiki generowanego dźwięku do preferencji słuchowych użytkownika. Paradoksalnie można zauważyć tendencję słuchania dźwięków o mniejszej dynamice, ale dających wrażenie dźwięków głośniejszych, znacznie silniejszych. W kontekście przetwarzania dyna[...]

Automatic prosodic modification in a Text-To-Speech synthesizer of polish language


  Speech synthesis plays an important part in human-computer interaction. Communication by voice is more likely to reach the attention of the user than text messages displayed on the screen. The voice messages generated by the synthesizer need to be intelligible and sound naturally. Unnatural sound of synthesized speech is likely to be annoying to the user and can worsen the comfort of working with the application. The synthesizer described in the paper is used as a part of an application based on eye tracking technology [1, 10]. Concatenative synthesis using diphones is employed. The advantage of such method is low database size and high intelligibility. However, the naturalness of diphone synthesis is not perfect. An utterance obtained simply by concatenation of segments without any modification is often perceived as flat and unnatural. The cause of such unnaturalness is the lack of prosody. In natural language people often tend to react to prosodic features of speech, such as intonation or accent, rather than to the actual content. Therefore, it is necessary to improve the naturalness by changing the prosodic features of the synthesized voice message. Automatic modification of prosody in a Text-To-Speech system is a process which requires two stages: automatic determination of prosodic features and the modification of speech segments, forcing the desired features on the synthesized speech. Both stages are described closer in the following subsections. With the use of the described methods a more natural speech can be obtained, whose prosodic features match those of natural spoken language. The implementation of prosody also improves the functionality of human-computer communication. By changing the intonation, accent or tempo, voice messages generated in the applications can be distinguished as statements, questions, commands etc. To assess the effectiveness of the proposed modifications, auditory tests were conducted. It w[...]

 Strona 1