![]() |
![]() |
![]() |
![]() Волумен 2 / 2002
|
|
|
|
Апстракт – Технологије и стандарди за мултимедију и мултимедија комуникацију се развијају брзо и према томе, посебан изазов је пратити широк спектар ових напредних технологија. Овај рад је један могући преглед фундаменталних и критичних аспеката управљања квалитетом сервиса QoS (Quality of Service) у мултимедијалним комуникацијама. Имплементација квалитета је есенцијална са развојем Internet/ATM технологија као универзалне платформе за глобалну мултисервисну комуникацију. У постојећим мрежама неопходна је резервација ресурса и механизми скалирања/филтрирања. Рутирање и систем цена су активне истраживачке област. У овом раду је наглашена је анализа Интернет сервиса, квалитета сервиса и основних архитектура управљања.
Кључне речи: Мултимедија. Комуникације
Abstract – The technology and standards for multimedia and multimedia communication are evolving quickly and, therefore, it is challenging to keep pace with wide spectrum of this rapidly advancing technologies. This paper is an overview of the fundamental and critical aspects of quality of service (QoS) management in multimedia communications. Implementing QoS is essential if the Internet/ATM is to become a universal platform for global multiservice communications. In existing networks, resource reservation and scaling/filtration mechanism are necessary. Routing and pricing are active research areas. In this paper, the emphasis is on the following analysis: Internet services, quality of services and basic architecture of quality of service management.
Key Words: Multimedia. Communication
|
проф.др ЗоранБојковић |
Апстракт: У раду је представљен програмски пакет за препознавање континуалног говора који за сада успешно функционише на малим и средњим речницима. Представљени су модули за обуку и препознавање, а на крају је дат и кратак преглед модула који су још увек у фази испитивања.
Кључне речи: Комуникације. Говор
Abstract: This paper shortly presents a program package for continuous speech recognition, named AlfaNumCASR. This HMM-based phoneme in context recognizer is successful with small and medium dictionaries. AlfaNumCASR is a product of several years of R&D in ASR topic, starting from isolated words recognition, over connected words, to continuous speech recognition. AlfaNumCASR employs some unique procedures described in this paper. The whole program is written in C++ programming language, and is fully developed by the authors. Software is in its largest part independent of the platform or the operating system. It includes two libraries developed in last two years by the same authors. Those are slib library for digital signal processing and general-purpose an_misc library.
Key Words: Communicaton. Speech.
Дарко Пекар |
|
Др Владо Делић |
Апстракт: У овом раду приказани су основни принципи и критеријуми за пројектовање и реализацију првог синтетизатора говора на српском језику оријентисаног на спајање говорних сегмената одабраних у реалном времену. Детаљно је описан генератор прозодијских обележја који је у оквиру овог система коришћен, с освртом на одређене специфичности српског језика које су утицале на његову реализацију. У раду је, осим тога, дат и преглед критеријума за online селекцију одговарајућих сегмената из обимне базе спонтаног говора.
Кључне речи: Српски језик. Говор
Abstract: This paper presents some basic criteria for conception of a concatenate TTS synthesizer in Serbian language. The paper describes the prosody generator which was used, and reflects upon several peculiarities of Serbian language which led to its adoption. The paper also describes the method of online selection of appropriate segments from a large speech corpus.
Key Words: Serbian Language. Speech
|
|
|
![]() Љубомир Јованов Факултет техничких наука, Нови Сад |
Апстракт: У овом раду, разматра се робусност Blind Signal Separation (BSS у даљем тексту) у временском као и у фреквентном домену, за одабирање говорника који најбоље одговара пристиглом сигналу. Алгоритам за обучавање мреже за селекцију говорника заснива се на максимизацији веродостојности (Maximum Likelihood) и тестиран је у реалним условима у соби са реверберацијом и без шума. Побољшање односа сигнал/сметња (која потиче од других говорника) у окружењу са два говорника која причају истовремено износило је 30 dB за оба говорника. Такође оба предложена алгоритма могу значајно побољшати тачност фонетског препознавача говора за више од 20%, посебно у случају велике интереференције. Предложени алгоритам могуће је користити у front-end процесирању при сепарацији више говорника у реалним условима при решавању ˝cocktail party˝ проблема.
Кључне речи: Раздвајање сигналa. BSS
Abstract: In this paper, we examine the robustness of Blind Signal Separation (BSS) in the time as well as the frequency domain, for separating competing speakers in real reverberant environments. The separation network’s learning rule is based on the Maximum Likelihood Estimation criterion and was tested in real room situations in a noise-free reverberant environment. The Signal to Interference Ratio improvement (SIR) in a two-simultaneous speaker environment was 30 dB for both speakers. Furthermore, both separation methods can significantly improve the accuracy of an automatic phoneme decoder, more than 20% especially in highly adverse environments. Therefore, it can be used as a front-end processor for separating multiple speakers in real room situations towards solving the cocktail party problem.
Key Words: Bind Signal Separation. BSS
Athanasios Koutras Electrical & ComputerEngineeringDept, University of Patras, Hellas E-mail: koutra@giapi.wcl2.ee.upatras |
Evangelos Dermatas Electrical & Computer EngineeringDept, University of Patras, Hellas |
Апстракт: Истраживања вибрација костију главе показују да се оне могу користити у говорним комуникацијама. Посебно је интересантна њихова примена у бучним срединама због мале осетљивости акцелерометра на амбијенталну буку. У раду су приказани резултати експерименталних мерења вибрација костију главе изазваних процесом говора. Експериментом су обухваћене четири кости главе говорника: темена (лат. оs parietalе), чеона (лат. оs frontale), јагодична (лат. os zigomaticum) и носна (лат. ос насале). Анализирана је динамика и 1/3-октавни спектри вибрација костију у поређењу са природним говором снимљеним на растојању 50 цм од уста говорника.
Кључне речи: Вибрације, кости главе. Говорне комуникације.
Abstract: In this paper the spectral characteristics of head bones vibration, inducted by speaker’s voice, are reported. Low-pass filtering is a main characteristic of speech signal based on head bones vibration. Dynamic range is reduced, too. Spectrographic analysis of head bones vibration shows that some unvoiced phonemes are missing. Unvoiced phonemes have insufficient energy to exit vocal tract surrounding tissue and bones to vibrations. In order to achieve suitable intelligibility of unvoiced phonemes the vibration sensor has to be placed as close as possible to the end of vocal tract, i.e. oral cavity.
Key Words: Vibrations, head bones. Speech communication.
Милан Војновић
ИНСТИТУТ БЕЗБЕДНОСТИ
Краљице Ане бб.,Београд
E-mail: milanv@eunet.yu
Апстракт: У овом раду представљена је модификација Lempel-Ziv алгоритма која омогућава вишеструко повећање степена компресије уз извесна оштећења слике. На основу активности слике која се мери локалном варијансом омогућено је маскирање грешке. У регијама са великом варијансом дозвољена су велика оштећења и обратно. Оваквим поступком остварује се велика компресија слике уз оштећења која минимално иритирају посматрача.
Кључне речи: Компресија. Слика
Abstract: In this paper a modification of Lempel-Ziv algorithm for lossy image compression is presented. With minor image distortion, much higher compression ratio can be achieved. Based on the local image activity, measured through local variance, criterion for error-masking is designed. In image areas with higher variance, a higher image distortion is allowed, and vice versa. By applying this method, minimal observers irritation with high compression ratio can be achieved.
Key Words: Compression. Image.
|
|
|
ИНФО М
Часопис за информациону технологију и мултимедијалне системе
• Динарска 14, Београд, Србија • Електронска
пошта • Телефон +381 (0)11 648-484 •
Продукција сајта: ТИА Јанус
(С) 2002-2003 ИНФО М и носиоци појединачних ауторских права. Сва права задржана.