System ekstrakcji informacji z raportów mamograficznych
Résumé
The paper presents a system for automatic content extraction from mammogram reports written in Polish. The system combines general information extraction (IE) techniques with external post-processing. The obtained data is normalized and linked to a simplified ontology. Then, the data is automatically grouped to form more complex structures, representing medical reports, and inserted to a database.
W artykule omówiony jest pakiet programów służących do automatycznego wydobycia informacji zawartych w raportach mammograficznych. Do tego celu wykorzystano techniki ekstrakcji informacji wspomagane dalszym, zewnętrznym przetwarzaniem. Uzyskane dane są sprowadzone do ujednoliconej postaci i znormalizowane, zgodnie z uproszczonym opisem dziedziny. Następnie dane są grupowane w logicznie spójne bloki i zapisywane w bazie danych.