Oferta

W nawiasach podane są nazwiska osób, z którymi należy się kontaktować w celu uzyskania dodatkowych informacji.


Zasoby


Korpus słowny JURISDIC

(Grażyna Demenko)
Korpus JURISDIC jest tworzony w celu dostarczenia materiału do uczenia i testowania systemu dyktowania tekstów, zawierających słownictwo potoczne i prawnicze, z uwzględnieniem systemów wyrazów izolowanych, systemów
wykrywania treści tekstowych w zbiorach dzwiękowych oraz systemów niezależnych od rodzaju słownictwa, opartych na modelowaniu całych wyrazów bądź mniejszych jednostek.
Korpus nagrań JURISDIC zawiera nagrania mowy pół-spontanicznej (kontrolowane dyktowanie) oraz nagrania mowy czytanej.
Specyfikacja korpusu JURISDIC uwzględnia ogólne cechy językowe oraz cechy szczególne języka polskiego na różnych poziomach analizy lingwistycznej i fonetycznej.
Sesja nagraniowa dla jednego mówcy trwa około 60 minut. Liczba mówców: 1000.

Leksykon

(Agnieszka Wagner)
Leksykon został częściowo przygotowany wg specyfikacji określonych w ramach projektu LC-Star. Na podstawie utworzonego wczesniej korpusu tekstów prasowych powstał leksykon wyrazów pospolitych (ok. 90000 jednostek), nazw własnych (uzupełniony z innych źródeł, ok. 47000 nazw) oraz leksykon pomocniczy zawierający m.in. skróty, liczby, litery alfabetu. Dodatkowo powstał leksykon frekwencyjny na postawie wygenerowanej listy form fleksyjnych najczęstszych wyrazów języka polskiego (dane wyselekcjonowano z róznych słowników).
Szczegółowe informacje znajdują się w Raporcie.


Oprogramowanie


Wykrywanie treści tekstowych w zbiorach dzwiękowych

(Stefan Grocholewski)
W zasobach policji znajduje się ogromna liczba nagrań. Przeszukiwanie tych nagrań, w celu znalezienia określonych treści tekstowych, na zasadzie odsłuchiwania tych nagrań jest niezwykle czasochłonne. Stąd potrzeba poszukiwania wspomnianych treści w sposób automatyczny. Aktualnie (jesień 2007) przeprowadzono pierwsze eksperymenty na nagraniach z „telefonu 118” bazując na technologii HMM. Słownik składa się ze wszystkich fonemów języka polskiego i poszukiwanego słowa (zbitki słów). Opracowano metodę eliminacji niewłaściwych kandydatów. Na Rysunku 1 z okollo 30 kandydatów system wybrał jedynie dwóch.



Rysunek 1: Okno programu WordSpotter.


Automatyczna weryfikacja i identyfikacja mówców

(Stefan Grocholewski)
Celem projektu jest stworzenie narzędzi do automatycznego lub półautomatycznego rozpoznawania głosów. Aktualnie (jesień 2007) stworzono podstawowe moduły bazujące na technologii GMM. Podstawowe problemy to: eliminacja wpływu kanału transmisyjnego, szumów otoczenia, zmienności międzyosobniczej a w szczególności wpływu emocji osoby mówiącej. Na Rysunku 2 pokazane jest okno programu Speaker Identification.

Speaker Identification window

Rysunek 2: Okno programu Speaker Identification.


Polphone (Marcin Szymański lub Marek Lange)


Pitch Line (Jerzy Ogórkiewicz)


System Anotacji dla Projektu Rozpoznawania Mowy PPBW

(Katarzyna Klessa)
Program „PPBW Annotation Database Manager”, zarządzający bazą danych, został zaprojektowany z zastosowaniem architektury Client-Server w ramach MSDE 2000 oraz Windows 2003 Server. Zarządza plikami dźwiękowymi, tekstowymi, danymi mówców, plikami anotacji, umożliwia tworzenie kopii bezpieczeństwa oraz statystyk czasu pracy oraz udostępnianie opcji dla wielu użytkowników o różnych poziomach uprawnień, jak również przeszukiwanie udostępnionych leksykonów. Dla celów segmentacji i etykietyzacji nagrań mowy w systemie zintegrowano program Transcriber, dostępny na zasadach oprogramowania otwartego.


Program do sprawdzania jakości bazy nagrań (Daniel Śledziński)


Boss (Marcin Szymański)


Automatic Close Copy Speech (ACCS) synthesis

(Jolanta Bachan)
Program do syntezy mowy metodą dokładnego kopiowania (ang. "close copy") oparty na syntezatorze difonowym MBROLA. ACCS jest zaprojektowany w taki sposób, aby mógł być używany dla różnych języków świata. Wymagania programu, aby mógł syntezować dany język, są następujące:

  1. baza difonów dla MBROLI (głos MBROLI) dla danego języka istnieje;
  2. korpus nagrań i anotacji tych nagrań na poziomie fonemów w formacie TextGrid jest dostępny;
  3. istnięją reguły mapujące inwentarz fonemowy użyty do anotacji na inwentarz fonemowy użyty w głosie MBROLI.

Automatic Close Copy Speech (ACCS) synthesis demo:


Testy percepcyjne dla dzieci z implantami ślimakowymi

(Jolanta Bachan)
Zestaw komputerowych testów percepcyjnych dla dzieci z implantami ślimakowymi. Testy sprawdzają zdolności percepcyjne i językowe, korzystając wyłącznie z bodźców akustycznych. Testy są zaprojektowane dla dzieci, które rozumieją mowę, ale mogą nie potrafić udzielać odpowiedzi werbalnych.


Sprzęt i oprogramowanie do nagrywania - Obejrzyj film! (Jerzy Ogórkiewicz)