Zespół Przetwarzania Sygnałów

Opis
Zespół Przetwarzania Sygnałów jest częścią Instytutu Elektroniki wchodzącego w skład Wydziału Informatyki, Elektroniki i Telekomunikacji Akademii Górniczo-Hutniczej w Krakowie. Członkowie grupy prowadzą badania nad różnymi aspektami cyfrowego przetwarzania sygnałów (DSP), koncentrując się głównie na przetwarzaniu mowy i sygnałów audio dla Internetu rzeczy (IoT), multimediów i aplikacji komunikacyjnych, a także przetwarzaniu sygnałów biomedycznych i audio-wideo dla wirtualnej i rozszerzonej rzeczywistości. Badania nad przetwarzaniem sygnałów opierają się na inteligentnej integracji klasycznych technik DSP, statystycznego przetwarzania sygnałów i uczenia maszynowego. Zespół Przetwarzania Sygnałów jest kierowany przez profesora Konrada Kowalczyka i składa się z kilkunastu pracowników naukowych i doktorantów. Zespół DSP współpracuje na arenie międzynarodowej z renomowanymi partnerami akademickimi (m.in. Johns Hopkins University, Tampere University, Brno University of Technology) oraz w kraju z lokalnym przemysłem, a także z powodzeniem zrealizował szereg projektów badawczych i komercyjnych. Zespół oferuje podstawowe i zaawansowane kursy z zakresu przetwarzania sygnałów, DSP, uczenia maszynowego i programowania dla aplikacji wbudowanych i multimedialnych zarówno na poziomie licencjackim, jak i magisterskim. Zespół Przetwarzania Sygnałów regularnie oferuje studentom pracę w projektach badawczych i badawczo-rozwojowych, a także zapewnia szeroki zakres prac dyplomowych i staży studenckich. Prace badawcze koncentrują się na zastosowaniu zaawansowanego przetwarzania sygnałów i uczenia maszynowego do przetwarzania mowy, dźwięku i sygnałów biomedycznych. Grupa prowadzi badania podstawowe i stosowane, a także zapewnia doradztwo i wsparcie technologiczne dla przemysłu. W dziedzinie przetwarzania mowy i sygnałów audio badania grupy koncentrują się na komunikacji, multimediach, Internecie rzeczy i aplikacjach wirtualnej rzeczywistości. Grupa opracowuje inteligentne ulepszanie głosu na potrzeby komunikacji głosowej i interfejsów człowiek-komputer Zespół Przetwarzania Sygnałów jest częścią Instytutu Elektroniki wchodzącego w skład Wydziału Informatyki, Elektroniki i Telekomunikacji Akademii Górniczo-Hutniczej w Krakowie. Członkowie grupy prowadzą badania nad różnymi aspektami cyfrowego przetwarzania sygnałów (DSP), koncentrując się głównie na przetwarzaniu mowy i sygnałów audio dla Internetu rzeczy (IoT), multimediów i aplikacji komunikacyjnych, a także przetwarzaniu sygnałów biomedycznych i audio-wideo dla wirtualnej i rozszerzonej rzeczywistości. Badania nad przetwarzaniem sygnałów opierają się na inteligentnej integracji klasycznych technik DSP, statystycznego przetwarzania sygnałów i uczenia maszynowego. Zespół Przetwarzania Sygnałów jest kierowany przez profesora Konrada Kowalczyka i składa się z kilkunastu pracowników naukowych i doktorantów. Zespół DSP współpracuje na arenie międzynarodowej z renomowanymi partnerami akademickimi (m.in. Johns Hopkins University, Tampere University, Brno University of Technology) oraz w kraju z lokalnym przemysłem, a także z powodzeniem zrealizował szereg projektów badawczych i komercyjnych. Zespół oferuje podstawowe i zaawansowane kursy z zakresu przetwarzania sygnałów, DSP, uczenia maszynowego i programowania dla aplikacji wbudowanych i multimedialnych zarówno na poziomie licencjackim, jak i magisterskim. Zespół Przetwarzania Sygnałów regularnie oferuje studentom pracę w projektach badawczych i badawczo-rozwojowych, a także zapewnia szeroki zakres prac dyplomowych i staży studenckich. Prace badawcze koncentrują się na zastosowaniu zaawansowanego przetwarzania sygnałów i uczenia maszynowego do przetwarzania mowy, dźwięku i sygnałów biomedycznych. Grupa prowadzi badania podstawowe i stosowane, a także zapewnia doradztwo i wsparcie technologiczne dla przemysłu. W dziedzinie przetwarzania mowy i sygnałów audio badania grupy koncentrują się na komunikacji, multimediach, Internecie rzeczy i aplikacjach wirtualnej rzeczywistości. Grupa opracowuje inteligentne ulepszanie głosu na potrzeby komunikacji głosowej i interfejsów człowiek-komputer (HCI) w oparciu o szeroką wiedzę specjalistyczną w zakresie ulepszania mowy, redukcji szumów, pogłosu, ekstrakcji sygnału wielokanałowego, przywracania jakości sygnału i separacji sygnału. Ponadto kompetencje zespołu obejmują lokalizację źródła z różnych zestawów mikrofonów i w ustawieniach rozproszonych, stosowanych między innymi w ratownictwie opartym na dronach. Z biegiem lat grupa zdobyła szeroką wiedzę w zakresie analizy i przetwarzania mowy, w tym weryfikacji mówcy, diaryzacji, rozpoznawania języka, rozpoznawania emocji, syntezy mowy i automatycznego rozpoznawania mowy. Ponadto nasza wiedza specjalistyczna dotyczy przetwarzania dźwięku przestrzennego, renderowania dźwięku przestrzennego przez słuchawki lub głośniki, z zastosowaniami od kina domowego, motoryzacji po rzeczywistość wirtualną i rozszerzoną. W kontekście tych ostatnich zastosowań, zainteresowania badawcze koncentrują się na doświadczeniu użytkownika podczas interakcji z robotami i wirtualnymi ludźmi. Ostatnim obszarem badawczym jest przetwarzanie sygnałów biomedycznych, w tym przetwarzanie sygnałów EEG i obrazów do zastosowań medycznych. Zespół Przetwarzania Sygnałów zaprasza przedstawicieli przemysłu do udziału w projektach badawczo-rozwojowych, doradztwa i weryfikacji technologii, licencjonowania opracowanej technologii, a także wsparcia przy wdrażaniu przetwarzania sygnałów w produktach klientów. Zespół przyjmuje również oferty badawcze od międzynarodowych partnerów akademickich zainteresowanych współpracą i wspólnymi wnioskami o projekty badawcze.
Projekty:
Przedmiotem projektu jest opracowanie generycznego systemu, którego celem jest ułatwienie i usprawnienie pracy lekarza, poprzez zautomatyzowanie procesu wypełniania Elektronicznej Dokumentacji Medycznej (EDM) oraz towarzyszących formularzy (recept, skierowań, zwolnień). Przedstawiony cel zostanie osiągnięty poprzez integrację systemu głosowego, składającego się z modułów sztucznej inteligencji (AI) odpowiedzialnych za automatyczne rozpoznawanie mowy (ASR) i przetwarzanie języka naturalnego (NLP), z formularzami medycznymi opracowanymi przez firmę Proassist. Wynikowy system umożliwi konwersję wypowiedzi lekarza na tekst, a następnie ekstrakcję pożądanych informacji i odpowiednie uzupełnienie formularzy. Zadania projektowe będą obejmować przygotowanie zanonimizowanej bazy nagrań wizyt lekarskich i wypełnionych formularzy, następnie przeprowadzenie odpowiedniej transkrypcji i anotacji nagrań, i na tej podstawie opracowany zostanie system głosowy w postaci modułów ASR i NLP dostosowany do zastosowań medycznych. Jedną z dodatkowych funkcjonalności systemu będzie możliwość głosowej komunikacji użytkownika z systemem poprzez wydawanie komend, do których będą przypisane konkretne akcje (np. aktywacja systemu, zaznaczenie pola formularza, czy też utworzenie nowego dokumentu). Ponadto, lekarz będzie miał możliwość utworzenia nowych szablonów (makr) głosowych i przypisania do nich szeregu akcji pozwalających na personalizację procesu obsługi systemu. Co więcej, na podstawie opracowanych w projekcie narzędzi i analiz zaprojektowane zostaną nowe formularze poprawiające ergonomię pracy lekarzy. Zaproponowany system będzie dostępny w formie aplikacji webowej, mobilnej oraz jako moduł umożliwiający integrację z oprogramowaniem EDM podmiotów zewnętrznych. Końcowe rozwiązanie pozwoli na znacznie szybsze wypełnianie dokumentacji medycznej, a co za tym idzie, lekarz będzie mógł poświęcić więcej czasu na przeprowadzenie pogłębionego wywiadu pacjenta. (INFOSTRATEG4/0029/2022)

Kontakt



12 617 36 39

Jednostka prowadząca

Wydział Informatyki, Elektroniki i Telekomunikacji - Instytut Elektroniki

Lider zespołu

Kowalczyk Konrad

Zespół

  • Witkowski Marcin
  • Kacprzak Stanisław
  • Woźniak Szymon
  • Rybicka Magdalena
  • Bartolewska Julitta
  • Fraś Mieszko
  • Żbik Mateusz
  • Barański Mateusz

Obszary badawcze IDUB

  • Inteligentne techniki informacyjne, telekomunikacyjne, komputerowe i sterowania

Słowa kluczowe