Kapronczay, Mór and Plangár, Bálint István (2017) Ki írta?: szövegek íróinak felismerése text mining segítségével. TDK dolgozat, BCE, Statisztika és ökonometriai szekció. Szabadon elérhető változat / Unrestricted version: http://publikaciok.lib.uni-corvinus.hu/publikus/tdk/Kapronczay_Mor_Plangar_Balint_TDK.pdf
|
PDF
- Requires a PDF viewer such as GSview, Xpdf or Adobe Acrobat Reader
1MB |
Szabadon elérhető változat: http://publikaciok.lib.uni-corvinus.hu/publikus/tdk/Kapronczay_Mor_Plangar_Balint_TDK.pdf
Absztrakt (kivonat)
A szerzők dolgozatukban szövegbányászati módszerekkel kísérlik meg eldönteni szövegekről, hogy a legnagyobb valószínűséggel az előzetesen megtanult szerzői profilok közül melyik profil birtokosa a szöveg szerzője. A szerzők egy benchmark modellt definiálnak, amely egyszerű statisztikák alkalmazásával a véletlennél kis mértékben képes jobb eredmény elérésére, azonban kifejtik véleményüket, miszerint komoly lehetőség van e modell fejlesztésére is. Végül a szerzők TF-IDF módszertanon alapuló modellje már szignifikánsan jobb eredményeket mutat, megközelítve a tökéletes hatékonyságot. Ugyanakkor a szerzők felhívják a figyelmet az eredmények alkalmazhatóságának korlátaira, a módszertan továbbfejlesztési irányaira is. Mindazonáltal a dolgozat a szerzők véleménye szerint releváns tanulságokkal szolgálhat a szövegbányászat klasszifikációs területének számos tekintetében.
Tétel típus: | TDK dolgozat |
---|---|
További információ: | 1. díj |
Témakör: | Statisztika |
Azonosító kód: | 10453 |
Elhelyezés dátuma: | 25 Jan 2018 09:49 |
Utolsó változtatás: | 25 Jan 2018 09:49 |
Csak a repozitórium munkatársainak: tétel módosító lap