Κωδικοποίηση κειμένου είναι η διαδικασία σήμανσης (markup) των δομικών, μορφολογικών και σημασιολογικών χαρακτηριστικών του με στόχο την περιγραφή του και την οργάνωση και ταξινόμηση των πληροφοριών που περιέχει σε δομημένα και διακριτά σύνολα.
Οι προκλήσεις της κωδικοποίησης οδήγησαν στη δημιουργία προτύπων περιγραφής και εργαλείων διαχείρισης των κειμένων αξιοποιώντας τις γλώσσες σήμανσης (π.χ. XML).
Το πρότυπο ΤΕΙ (Text Encoding Initiative) αποτελεί μια από τις σημαντικότερες κειμενοκεντρικές εφαρμογές της ψηφιακής τεχνολογίας σήμανσης στο πεδίο των DH με βάση την γλώσσα XML που εξασφαλίζει έναν ομοιόμορφο τρόπο περιγραφής και αναπαράστασης των ηλεκτρονικών κειμένων που αναγνωρίζεται από όλους τους υπολογιστές.
Παρουσίαση ενότητας 7 Τελευταία ενημέρωση: 10/12/2022 |
|
Σημειώσεις ενότητας 7 Τελευταία ενημέρωση: 10/12/2022 |
|
Άσκηση DH-12 "Κωδικοποίηση κειμένου με την εφαρμογή Transkribus" Τελευταία ενημέρωση: 10/12/2022 |
|
Άσκηση DH-13 "Kωδικοποίηση κειμένου με βάση το πρότυπο TEI" Τελευταία ενημέρωση: 10/12/2022 |