Popis tématu

Diplomová práce v oboru Ostatní / Nespecifikováno.

Možnosti generování databázových dotazů pro průzkum dat

*Téma je rámcové a bude upraveno dle úrovně práce (BP/DP) a úvodní diskuze se studentem.*

S boomem generativní AI se vytvořilo několik Text2SQL modelů, které se snaží na základě uživatelských promtů vygenerovat vhodné SQL vyhledávací příkazy a případně nějak rekurzivně provolávat databázi k dosažení požadovaného výsledku. Podobné modely existují i pro další dotazovací jazyky.

V našem případě bychom chtěli prozkoumat možnost vystavění wrapperu nad MongoDB, resp. kolekcí Json dokumentů, který by umožňoval průzkum dat v obecné kolekci aniž by uživatel musel důvěrně ovládat příslušný dotazovací jazyk. Pro testování a validaci výsledků je možné použít data z projektu https://www.inventariarudolphina.com/ případně http://documenta.rudolphina.com/ .

Orientační body zadání (rámcově):
* prozkoumejte současné možnosti Text2SQL a modelů pro dotazování nad MongoDB
* navrhněte testovací scénář a hodnotící metriky pro vyhodnocení jejich kvality v kontextu našich dat
* implementujte webový wrapper pro práci s modelem
* diskutujte řešení

Téma vypsal: Ing. Martin Kryl (UN 326)

Vypsáno pro akademický rok 2024/2025 dne: 2024-05-06

Rezervace tématu

Toto téma je zatím volné. Pokud o téma máte vážný zájem, vyplňte prosím následující formulář, kterým si téma zamluvíte (všechny položky jsou povinné).

Jméno a příjmení:

Studijní číslo: Email:

Aktualizováno 0