«Το μέσο κοινωνικής δικτύωσης twitter ως πηγής εθελοντικής γεωγραφικής πληροφορίας για την εξαγωγή μακροσεισμικών παρατηρήσεων και την ανάπτυξη χαρτών μακροσεισμικής έντασης»

σε Έρευνες
image_pdfimage_print

Αραποστάθης  Γ. Ευστάθιος 1

Sarapos@hua.gr Βενιζέλου Ελ. 70 17671 Καλλιθέα Αθηνα. www.geografos.gr

Η διατριβή αποτελεί μία διεπιστημονική προσέγγιση στο χώρο της Γεω-πληροφορικής συνδυάζοντας μία σειρά από επί μέρους ερευνητικά πεδία και δεξιότητες που άπτονται στον τομέα της σεισμολογίας και ιδιαίτερα στη μέτρηση της έντασης των σεισμών, στον τομέα των μεγάλων δεδομένων (big data) και ιδιαίτερα στον τομέα της Εθελοντικής Γεωγραφικής Πληροφορίας (Volunteered Geographic Information – VGI).

Ως εθελοντική Γεωγραφική Πληροφορία ορίζεται η διαδικασία παραγωγής γεωγραφικού περιεχομένου, συνήθως από μία διαδικτυακή υπηρεσία (web service) από απλούς πολίτες οι οποίοι περιγράφονται ως εθελοντές. Ο ερευνητής που ανίχνευσε πρώτος το φαινόμενο αυτό είναι ο Goodchild (2007) ενώ παρεμφερείς όροι είναι τα συμμετοχικά γεωγραφικά πληροφοριακά συστήματα (Participatory GIS) και η νέο-γεωγραφία (neo-geography).

Το ερευνητικό πεδίο των μεγάλων δεδομένων αποτελεί ουσιαστικά το σύνολο των μεθοδολογιών, πρακτικών, τεχνικών και εφαρμογών σχετικά με την εξόρυξη γνώσης μέσα από τεράστιες βάσεις δεδομένων οι οποίες, χωρίς αυτές τις μεθόδους θα ήταν από χρονοβόρο ως αδύνατο να αναλυθούν.

Τέλος, σε ό,τι αφορά τη μακροσεισμική ένταση, αποτελεί μία ιδιαίτερα σημαντική διαδικασία για τους σεισμολόγους καθώς μέσω της χαρτογράφησής της, μπορούν να μελετηθούν οι συνέπειες του σεισμού στο φυσικό και οικιστικό περιβάλλον, ο βαθμός αναστάτωσης που προκλήθηκε, να πραγματοποιηθεί συστηματική μελέτη της χωρικής κατανομής της έντασης και να συγκριθεί η αισθητότητα διαφόρων σεισμών που πραγματοποιήθηκαν στην ίδια περιοχή. Η διαδικασία της συλλογής των απαραίτητων δεδομένων, γνωστών ως μακροσεισμικών παρατηρήσεων, περιλαμβάνει τη συμπλήρωση ερωτηματολογίων είτε από πολίτες, είτε από εκπαιδευμένο προσωπικό των δήμων ή των περιφερειών. Οι παραδοσιακοί τρόποι διανομής των ερωτηματολογίων αποτελούνται από τη διανομή μέσω ραδιοφώνου, ταχυδρομείου, τηλεόρασης και ηλεκτρονικού ταχυδρομείου. Πιο σύγχρονες προσεγγίσεις όπως αυτή του ΕυρωΜεσογειακού Σεισμολογικού Κέντρου (EMSC), περιλαμβάνουν τη διανομή on line ερωτηματολογίων μέσω διαδικτύου, η επεξεργασία των οποίων καθώς και η αποτύπωσή τους στο χάρτη γίνεται σε πραγματικό ή σχεδόν πραγματικό χρόνο. Προγενέστερη παρόμοια δράση αποτελεί εκείνη του Αμερικανικού Γεωλογικού Κέντρου (USGS), με την ονομασία Did you feel it? Ενώ όμοια δραστηριότητα έχει πραγματοποιήσει και το Εθνικό Αστεροσκοπείο Αθηνών. Τέλος σε μερικές περιπτώσεις η εξόρυξη των μακροσεισμικών παρατηρήσεων πραγματοποιείται από απλές μαρτυρίες, και κείμενα τα οποία δεν έχουν συγκεκριμένη δομή η προέλευση και η διαθεσιμότητα των οποίων εξαρτάται από την αναζήτηση πληροφοριών για ιστορικούς σεισμούς σε βιβλία, ή από την ύπαρξη ελεύθερων κειμένων που αποστέλλονται στα ερευνητικά αυτά κέντρα.

Μία μικρή καινοτομία της διατριβής, ως προς το ερευνητικό πεδίο της σεισμολογίας, αποτελεί το ότι πηγή πληροφόρησης είναι τα μέσα κοινωνικής δικτύωσης και συγκεκριμένα το twitter. Το εν λόγω μέσο κοινωνικής δικτύωσης έχει μερικά συγκριτικά πλεονεκτήματα τα οποία το αναδεικνύουν ώς μία από τις ιδανικότερες επιλογές για τη δημιουργία χαρτών μακροσεισμικής έντασης. Αυτά περιλαμβάνουν την άμεση δημοσίευση σύντομων σε έκταση μηνυμάτων, τη δυνατότητα συμπερίληψης γεωγραφικών συντεταγμένων θέσης δημοσίευσης, καθώς και διάφορα άλλα συστατικά της σημασιολογίας των παραγόμενων δεδομένων όπως η καταγραφή της γλώσσας, η δυνατότητα επανα-δημοσιοποίησης μίας είδησης, η καταγραφή της χρονικής στιγμής δημοσίευσης κοκ. Τα αναφερθέντα χαρακτηριστικά μαζί με την τεράστια δημοφιλία του εν λόγω κοινωνικού δικτύου, καθώς εκατοντάδες εκατομμύρια χρήστες δημοσιεύουν πληροφορίες καθημερινά, το αναδεικνύουν ως την ιδανικότερη πηγή εθελοντικών δεδομένων. Λαμβάνοντας υπόψη όλα τα ανωτέρω ως αρχική υπόθεση εργασίας αναμένεται η ύπαρξη πολλών χρήσιμων πληροφοριών σχετικά με τα μακροσεισμικά αποτελέσματα ενός σεισμού.

Μεθοδολογία εξόρυξης μακροσεισμικών παρατηρήσεων και κατασκευής μακροσεισμικών χαρτών:

Η ακολουθούμενη μεθοδολογία περιλαμβάνει εννέα ουσιαστικά βήματα. Το πρώτο αφορά στην προετοιμασία δεδομένων από το twitter, επιλέγοντας αρχικά εκείνα τα οποία είναι στην ελληνική και στην αγγλική γλώσσα, εμπεριέχεται στα κείμενα τους τουλάχιστον μία από προσυμφωνημένες λέξεις κλειδιά όπως σεισμός, ζημιές κλπ, ενώ η χρονική περίοδος δημοσίευσης φτάνει έως και τις 48 ώρες από τη χρονική στιγμή του σεισμικού γεγονότος. Το δεύτερο βήμα αποτελείται από τη διάκριση εκείνων των tweets που περιλαμβάνουν μακροσεισμικά αποτελέσματα ενώ το τρίτο βήμα απαρτίζεται από την περαιτέρω διάκρισή τους σε εκείνα που έχουν γεωγραφική αναφορά εντός του κειμένου τους. Το τέταρτο βήμα σχετίζεται με την ταξινόμηση κάθε ενός tweet σε τιμές της μακροσεισμικής κλίμακας EMS 98. Η διαδικασία αυτή αρχικά περιλαμβάνει την ανάγνωση κάθε ενός tweet ξεχωριστά ούτως ώστε, αρχικά να διερευνηθεί η πιθανότητα ύπαρξης μακροσεισμικής πληροφορίας, και δευτερευόντως η δυνατότητα ταξινόμησης σύμφωνα με την επίσημη περιγραφή της κλίμακας. Κατά την εξέλιξη της διαδικασίας αυτής, ανιχνεύονται διάφορα πρότυπα ταξινόμησης, μερικές συγκεκριμένες λέξεις δηλαδή οι οποίες πάντοτε ταξινομούνται σε συγκεκριμένη τιμή της EMS 98. Επόμενο βήμα της μεθοδολογίας αποτελεί η προσθήκη των γεωγραφικών συντεταγμένων για κάθε tweet που εμπεριέχει γεωγραφική αναφορά στο κείμενό του. Στις περιπτώσεις εκείνες που ένα tweet περιλαμβάνει περισσότερες από μία γεωγραφικές αναφορές, το tweet κλωνοποιείται και σε κάθε ένα προστίθενται οι γεωγραφικές συντεταγμένες για κάθε μία γεωγραφική αναφορά αντίστοιχα. Εν συνεχεία, ως επόμενο βήμα της μεθοδολογίας, τα tweets εισάγονται ως σημειακό θεματικό επίπεδο σε σύστημα γεωγραφικών πληροφοριών και πραγματοποιούνται διάφορες τεχνικές επεξεργασίας. Αυτές περιλαμβάνουν την τυχαιοποίηση της χωρικής κατανομής των μακροσεισμικών παρατηρήσεων εντός του πολυγώνου που ορίζει τα όρια της γεωγραφικής αναφοράς που εμπεριέχεται στα κείμενα των tweets. Άλλες διεργασίες αφορούν στη δημιουργία ξεχωριστών θεματικών επιπέδων ανά χρονικές περιόδους και στην αυτόματη καταμέτρηση των μακροσεισμικών παρατηρήσεων ανά γεωγραφική περιοχή και ανά χρονική περίοδο. Τέλος πραγματοποιείται η εφαρμογή της χωρικής παρεμβολής τιμών kriging για τη δημιουργία ενός μοντέλου τιμών έντασης το οποίο μαζί με τη χάραξη ισόσειστων καμπυλών απαρτίζει τους χάρτες μακροσεισμικής έντασης.

Σεισμικά γεγονότα που διερευνήθηκαν:

Κατά τη διάρκεια της διερεύνησης της ορθότητας της μεθοδολογίας, χρησιμοποιήθηκαν δεδομένα από δύο σεισμικά γεγονότα που συνέβησαν στον Ελλαδικό χώρο το 2014 και έχουν τελείως διαφορετικά χαρακτηριστικά. Τα δύο σεισμικά γεγονότα είναι ο σεισμός της Κεφαλονιάς, μεγέθους ML = 5.8 και ο οποίος συνέβη τον Ιανουάριο του 2014 και ο διπλός σεισμός του Ευβοϊκού, μεγέθους ML = 5.2 ο οποίος συνέβη τον Νοέμβριο του 2014.

Ο σεισμός της Κεφαλονιάς, είχε μεγάλες συνέπειες στο φυσικό και οικιστικό περιβάλλον, πραγματοποιήθηκε κατά τη διάρκεια της ημέρας. Το γεγονός ότι το επίκεντρό του εν λόγω σεισμού βρίσκεται αρκετά μακριά από την Αθήνα, και σε περίοδο μη τουριστική άρα χωρίς να υπάρχει ιδιαίτερα μεγάλη πληθυσμιακή πυκνότητα, τον αναδεικνύει ως μία καλή περίπτωση διερεύνησης της μεθοδολογίας σε απομακρυσμένα σεισμικά συμβάντα. Εν συνεχεία ο σεισμός του Ευβοϊκού έχει τελείως αντίθετα σεισμικά χαρακτηριστικά. Αρχικά συνέβη βραδινή ώρα, κοντά στη Χαλκίδα αλλά έγινε αισθητός στο ΠΣ Αθηνών – Πειραιώς. Τέλος τα μακροσεισμικά αποτελέσματα του σεισμού είναι σχετικά αμελητέα καθώς ελάχιστες ήταν οι ζημιές σε κτίρια οι οποίες χωροθετούνται στην περιοχή της Χαλκίδας. Έτσι ο σεισμός αυτός κρίνεται ιδανικός για τη διερεύνηση της καταλληλότητας της μεθοδολογίας σε σεισμικά γεγονότα χωρίς ιδιαίτερες συνέπειες και που το επίκεντρο των οποίων βρίσκεται κοντά σε μεγάλα αστικά κέντρα.

Δεδομένα:

Για τις ανάγκες της διατριβής αγοράστηκαν δύο σετ δεδομένων twitter από δύο διαφορετικούς παρόχους. Συγκεκριμένα το σετ δεδομένων της Κεφαλονιάς αγοράστηκε από τον πάροχο Gnip και αποτελείται από 167.989 tweets που δημοσιεύθηκαν από τις 26-01-2018 και ώρα GMT 00:00:01 έως τις 17-2-2018 και ώρα 23:59:59. Τα tweets αυτά εμπεριέχουν τουλάχιστον μία από τις λέξεις: σεισμός, ρίχτερ, Κεφαλονιά, (στα ελληνικά, στα αγγλικά και στα λατινοποιημένα ελληνικά). Τέλος περίπου του 1% του συνόλου (1721), εμπεριέχει tweets με γεωγραφικές συντεταγμένες θέσης δημοσίευσης.

Το σετ δεδομένων του Ευβοϊκού αγοράστηκαν από τον πάροχο discover text και αποτελείται από 88,128 tweets τα οποία δημοσιεύθηκαν από τις 17-11-2014 και ώρα GMT 00:00:01 ως τις 20-11-2014 και ώρα 23:59:59. Τα εν λόγω tweets εμπεριέχουν τουλάχιστον μία από τις ακόλουθες λέξεις στα κείμενά τους: Ευβοϊκός, Χαλκίδα, σεισμός, ρίχτερ αισθητός, ζημιές στα Αγγλικά, τα ελληνικά και τα λατινοποιημένα ελληνικά. Το εν λόγω σετ δεδομένων δεν περιλαμβάνει τις γεωγραφικές συντεταγμένες θέσης δημοσίευσης (geo-located tweets).

Ανάλυση και στατιστικά δεδομένα:

Κεφαλονιά:

Σε σχέση με το σεισμό της Κεφαλονιάς, αρχικά πραγματοποιήθηκε ανάλυση των tweets που εμπεριείχαν γεωγραφικές συντεταγμένες θέσης δημοσίευσης. Ο συνολικός αριθμός αυτών των tweets ανέρχεται σε 1721, τα 245 των οποίων χωροθετούνται στον Ελλαδικό χώρο, ενώ 28 από αυτά εμπεριείχαν μακροσεισμικές παρατηρήσεις. Ο αριθμός αυτός των μακροσεισμικών παρατηρήσεων δε κρίθηκε ικανοποιητικός για την εξαγωγή κάποιου γόνιμου συμπεράσματος αφενός, διότι οι 28 αυτές παρατηρήσεις δεν ήταν παρατηρήσεις ειδικών και ως εκ τούτου δεν εμπεριείχαν το σύνολο της κατάστασης της περιοχής στην οποία βρίσκονται, και αφετέρου η χωρική τους κατανομή δεν ήταν ικανοποιητική ούτως ώστε να εφαρμοστεί με επιτυχία κάποια τεχνική χωρικής παρεμβολής τιμών.

Σε συνέχεια της ανάλυσης, κατά τη διάρκεια της δοκιμής της μεθοδολογίας στα δύο σεισμικά γεγονότα, αναγνώστηκαν 17678 tweets στην ελληνική γλώσσα και τα οποία δημοσιεύθηκαν εντός 48 ωρών από το σεισμικό συμβάν της Κεφαλονιάς και το σύνολο σχεδόν των tweets του σεισμικού γεγονότος του Ευβοϊκού . Από αυτά, εν τέλει διακρίθηκαν 578 και 1040 μακροσεισμικές παρατηρήσεις αντίστοιχα οι οποίες εμπεριέχουν και γεωγραφική αναφορά εντός του κειμένου των tweets. Κατά τη διάρκεια της ανάλυσης και κυρίως σε ό,τι αφορά την ανάλυση του σεισμικού γεγονότος του Ευβοϊκού η διάκριση πραγματοποιήθηκε και με τη χρήση διαφόρων λεκτικών ερωτημάτων (text queries) με τα οποία ήταν δυνατή η επιλογή πολλών σχετικών tweet ταυτόχρονα. Εν συνεχεία, τα tweets αυτά ταξινομήθηκαν σε τιμές της μακροσεισμικής κλίμακας EMS 98. Η βαθμονόμηση, σε ότι αφορά το σεισμό της Κεφαλονιάς πραγματοποιήθηκε διαβάζοντας όλα τα tweets 1-1, καθώς ήταν ο μοναδικός τρόπος για να αιτιολογηθεί κάθε ταξινόμηση σε σχέση με την επίσημη περιγραφή της κλίμακας EMS 98. Έπειτα από την ταξινόμηση αυτή, ανιχνεύθηκαν διάφορα λεκτικά πρότυπα ταξινόμησης τα οποία και περιγράφονται στον πίνακα 1. Τα λεκτικά αυτά πρότυπα εφαρμόστηκαν αυτόματα στο σεισμό του Ευβοϊκού ούτως ώστε να διαπιστωθεί η ευστάθειά τους. Κατά τη διάρκεια της ταξινόμησης, εκτός από το κείμενο λήφθηκαν υπόψη και διάφοροι υπερ-σύνδεσμοι που οδηγούσαν σε φωτογραφικό υλικό και τα οποία βοήθησαν ιδιαίτερα τη διαδικασία αυτή. Επόμενο βήμα της μεθοδολογίας αποτέλεσε η προσθήκη των γεωγραφικών συντεταγμένων των γεωγραφικών αναφορών που εμπεριέχονταν στα κείμενα των tweet με τον τρόπο που περιγράφεται στην ενότητα περιγραφής της μεθοδολογίας. Εν συνεχεία, τα δεδομένα αυτά εισήχθησαν ως σημειακό θεματικό επίπεδο σε σύστημα γεωγραφικών πληροφοριών όπου και πραγματοποιήθηκε η τεχνική της τυχαιοποίησης της χωρικής κατανομής των σημείων εντός πάντα το πολυγώνου που ορίζει τα όρια των γεωγραφικών αναφορών των tweets. Η τεχνική αυτή πραγματοποιήθηκε ούτως ώστε να γίνει με όσο το δυνατόν πιο ορθό τρόπο η χαρτογραφική αναπαράσταση της πληροφορίας. Είναι βέβαιο ότι οδηγεί σε πιο ορθά συμπεράσματα, γενικευμένα συνήθως σε επίπεδα οικισμού ή δήμου κάτι όμως που μάλλον ενισχύει την ορθότητα της μεθόδου καθώς οι γενικές κατευθύνσεις όπως αυτές διατυπώνονται στην επίσημη περιγραφή της μακροσεισμικής κλίμακας EMS 98 αναφέρουν ξεκάθαρα πως ο στόχος είναι η αποτύπωση της έντασης σε αυτή την κλίμακα. Πραγματοποιήθηκαν ακόμη διάφορες λειτουργίες όπως η αυτόματη καταμέτρηση μακροσεισμικών παρατηρήσεων ανά γεωγραφική περιοχή, και η δημιουργία σημειακών θεματικών επιπέδων ανά χρονική περίοδο δημοσίευσης των παρατηρήσεων (6, 12, 24 και 48 ωρών).

Τέλος για κάθε χρονική περίοδο και για κάθε σεισμικό γεγονός πραγματοποιήθηκε η χωρική παρεμβολή τιμών kriging η οποία εμφανίζεται στη βιβλιογραφία ως η καταλληλότερη μέθοδος για τον υπολογισμό τιμών που σχετίζονται με φυσικά φαινόμενα (βιβλιογραφικές αναφορές).

Αποτελέσματα:

Πίνακας Ι: Πρότυπα λέξεων – ταξινόμησης

Χάρτες μακροσεισμικής έντασης σεισμού Κεφαλονιάς (αριστερά), σεισμού Ευβοϊκού (δεξιά)

Σε ό,τι αφορά το σεισμικό γεγονός της Κεφαλονιάς, αποτυπώνεται ένα εύρος τιμών από I ως VIII. Οι υψηλότερες τιμές έντασης παρατηρούνται στο νησί της Κεφαλονιάς, στο βόρειο τμήμα της Ζακύνθου και στο νότιο τμήμα της Λευκάδας. Η ηπειρωτική Ελλάδα που βρίσκεται Όλες οι υπόλοιπες περιοχές λαμβάνουν τιμές κοντά στο III με εξαίρεση το χάρτη των 6 ωρών που αποτυπώνει στην περιοχή της Θεσσαλίας τιμές έντασης II. Έπειτα από σχετική διερεύνηση η χωρική αυτή ανομοιογένεια παρατηρήθηκε λόγω έλλειψης αρκετού πλήθους δεδομένων στη συγκεκριμένη αυτή περιοχή. Τέλος, αξίζει να σημειωθεί ότι η χωρική κατανομή της έντασης σχηματίζει τις οροσειρές της Πίνδου γεγονός που αποτελεί εμπειρική απόδειξη για την ορθότητα της κατανομής. Σε ό,τι αφορά το χάρτη του Ευβοϊκού, το εύρος τιμών έντασης που αποτυπώνεται κυμαίνεται μεταξύ I και V. Οι υψηλότερες τιμές έντασης παρατηρούνται στην κεντρική και βόρεια Εύβοια με την Βοιωτία και την Αττική να συγκεντρώνουν τιμές III – IV ενώ η υπόλοιπη Ελλάδα εμφανίζει τιμές από Ι ως II.

Έπειτα από σύγκριση των αποτελεσμάτων με χάρτες που έχουν δημοσιευθεί από διεθνή ινστιτούτα όπως το usgs και το emsc και που έχουν δημιουργηθεί με τις παραδοσιακές μεθόδους, παρατηρείται αρκετά καλή ταύτιση, γεγονός που αναδεικνύει την μεθοδολογία ως μία καλή εναλλακτική πρόταση για την ανάπτυξη χαρτών μακροσεισμικής έντασης. Τέλος, λαμβάνοντας υπόψη το γεγονός πως με την πάροδο του χρόνου τα δεδομένα από τα μέσα κοινωνικής δικτύωσης αναμένεται να είναι ακόμη περισσότερα, μεθοδολογίες αξιοποίησης των παραγόμενων από αυτά δεδομένων αναμένεται να έχουν ραγδαία ανάπτυξη στο μέλλον, αντικαθιστώντας εν τέλη ακόμη και τις παραδοσιακότερες μεθόδους συλλογής δεδομένων.

Βιβλιογραφία:

Arapostathis S. G., Parcharidis I., Stefanakis E., Drakatos G., Kalogeras I. (2016) A method for developing seismic intensity maps from twitter data . Journal of Civil Engineering and Architecture. DOI:10.17265/1934-7359/2016.07.013

Goodchild M. (2007) Citizens as sensors GeoJournal 69 (4), 211-221, 2007

Αραποστάθης Σ. (2016) Το μέσο κοινωνικής δικτύωσης Twitter ως πηγής εθελοντικής γεωγραφικής πληροφορίας για την εξαγωγή μακροσεισμικών παρατηρήσεων και την ανάπτυξη χαρτών μακροσεισμιλης έντασης. Διδακτορική διατριβή, Χαροκόπειο Πανεπιστήμιο, τμήμα Γεωγραφίας.


Υποσημειώσεις

  1. Γεωγράφος, MSc, PhD www.geografos.gr
Ετικέτες:

Πρόσφατα από Έρευνες

^