Popis tématu

Diplomová práce v oboru Ostatní / Nespecifikováno.

Automatické shlukování skenovaných dokumentů

Cílem této práce je vytvoření automatického shlukování textových dokumentů (tištěné či ručně psané), které jsou dostupné pouze ve skenovaném (obrazovém) formátu. Výsledkem by měla být funkční metoda, která bude rozdělovat dokumenty do různých skupin. Každá skupina by měla ideálně obsahovat dokumenty, které spolu souvisejí: vypadají podobně a reprezentují stejnou třídu: např. ručně psané poznámky, faktury, emaily, formuláře, atd..

Diplomantův úkol bude v první řadě prozkoumat dostupné metody využitelné pro shlukování obrazových dokumentů (případně obrázků obecně) a další metody s učením bez učitele (tzv. unsupervised). Následně dle dohody s vedoucím práce implementuje některé metody s cílem maximalizovat úspěšnost na zvolené datové sadě. Očekává se rovněž i kritická analýza použitelnosti.

Téma vypsal: Ing. Jiří Martínek, Ph.D. (UN 337)

Vypsáno pro akademický rok 2023/2024 dne: 2023-04-26

Rezervace tématu

Toto téma je sice volné, ale protože bylo vypsáno pro akademický rok 2023/2024, tak ho již nelze rezervovat. Pro případné bližší informace kontaktujte osobu, která téma vypsala.

Aktualizováno 0