Τα μεγάλα δεδομένα είναι ένα πεδίο που αντιμετωπίζει τους τρόπους ανάλυσης, συστηματικής απόσπασης πληροφοριών ή άλλης αντιμετώπισης με σύνολα δεδομένων που είναι πολύ μεγάλα ή περίπλοκα για να αντιμετωπιστούν από το παραδοσιακό λογισμικό εφαρμογών επεξεργασίας δεδομένων. Με απλά λόγια, τα μεγάλα δεδομένα είναι μεγαλύτερα, πιο σύνθετα σύνολα δεδομένων από διαφορετικές πηγές δεδομένων. Αυτά τα σύνολα δεδομένων είναι τόσο ογκώδη που το παραδοσιακό λογισμικό επεξεργασίας δεδομένων δεν μπορεί να τα διαχειριστεί. Ωστόσο, αυτοί οι τεράστιοι όγκοι δεδομένων μπορούν να χρησιμοποιηθούν για την αντιμετώπιση πιο σύνθετων προβλημάτων που δεν θα μπορούσαν να αντιμετωπιστούν προηγουμένως. Τα «Μεγάλα Δεδομένα» προσδιορίζονται από 6 βασικά χαρακτηριστικά.

Όγκος

Το μέγεθος των δεδομένων καθορίζει αν θα χαρακτηριστούν «μεγάλα» και εννοείται πως εδώ δεν μιλάμε για κάποια δείγμα αλλά για το σύνολο των δεδομένων. Φανταστείτε εδώ εταιρίες όπως το Facebook τι όγκο δεδομένων καλούνται να αποθηκεύουν και να επεξεργάζονται. Μόνο στην Ελλάδα το Facebook έχει πλέον 5 εκατομμύρια χρήστες οι οποίοι μοιράζονται από φωτογραφίες και βίντεο μέχρι ενημερώσεις και δημογραφικά στοιχεία.

Ταχύτητα

Η ταχύτητα δηλαδή με την οποία παράγονται, αποθηκεύονται και επεξεργάζονται προκειμένου να αντιμετωπίσουν τις προκλήσεις ενός ολοένα αναπτυσσόμενου περιβάλλοντος. Εδώ μάλιστα η δυνατότητα να μπορέσουν να αναλυθούν σε πραγματικό χρόνο (Real time), ανοίγει για παράδειγμα ένα νέο τοπίο στη διαφήμιση: ο πελάτης που είδε ένα προϊόν στο website μιας εταιρίας αλλά δεν το αγόρασε και εγκατέλειψε το site, θα μπορέσει να στοχευτεί άμεσα από την ίδια την εταιρία βλέποντας σε διαφήμιση το προϊόν που σκεφτόταν μόλις πριν να αγοράσει.

Ποικιλία

Ανταλλάσουμε καθημερινά από κείμενα μέχρι ηχητικά μηνύματα και live video. Θέλουμε στα social media να δημοσιεύσουμε μία σκέψη αλλά και μία φωτογραφία για να μοιραστούμε μία στιγμή με τους φίλους μας. Πλέον, στο Facebook δίνεται η δυνατότητα να δεις σε ένα παγκόσμιο χάρτη, ποιοι χρήστες είναι σε live video broadcasting αυτή τη στιγμή με δυνατότητα να παρακολουθήσεις και εσύ τι λένε

Μεταβλητότητα

Τα δεδομένα αλλά και το νόημά τους διαρκώς αλλάζει. Αυτό σημαίνει ότι μπορεί μία λέξη που κατά βάση έχει θετική σημασία, μπορεί να χρησιμοποιηθεί με τρόπο που να υποδηλώνει μία αρνητική έκφραση. Για παράδειγμα η φράση «Τέλεια τα πήγες σήμερα!» υποδηλώνει θετική στάση ενώ η φράση «Τέλεια... έχασα ένα διήμερο να προσπαθώ για κάτι που δεν το χρησιμοποίησες ποτέ» υποδηλώνει κάτι το αρνητικό. Επομένως το «τέλεια» δεν αρκεί μόνο του για να καταλάβουμε αν η άποψη που διατυπώνεται είναι θετική αλλά χρειάζεται να διαβάσουμε όλη τη φράση για να καταλάβουμε το νόημα. Με την «έκρηξη» των social media, η «ανάλυση συναισθήματος» είναι μία νέα πρόκληση για τις εταιρίες αλλά και για τα πολιτικά πρόσωπα, που προσπαθούν να καταλάβουν μέσα σε εκατομμύρια αναρτήσεις αν η γνώμη που εκφράζεται ερμηνεύεται ως αρνητική, θετική ή ως ουδέτερη μέσα από αυτόματο εντοπισμό. Παρά τη δυσκολία, ήδη κάποιες εταιρίες προσπαθούν να εφαρμόσουν μηχανισμούς ανάλυσης των απόψεων των χρηστών που θέτονται καθημερινά στα social media.

Ακρίβεια

Τα μεγάλα δεδομένα δεν έχουν νοήμα αν δεν είναι ακριβή τα στοιχεία. Η ποιότητα των δεδομένων θα επηρεάσει επομένως την ανάλυση. Φανταστείτε να είχατε με κάποιο τρόπο τα στοιχεία συμπεριφοράς ενός χρήστη και να θέλατε να βγάλετε αυτόματα μία απόφαση για την πρόθεση αγοράς του. Αν τα στοιχεία που είχατε ήταν ανακριβή, τότε και η ανάλυση που θα γινόταν, δεν θα ήταν ποιοτική και ακριβής.

Αξία

Τα δεδομένα δεν έχουν αξία αν δεν μπορούμε να τα μετατρέψουμε σε αξία. ΄Ηδη κάποιοι από εμάς έχουμε δει την αξία τους, μιας και θα έχουμε χρησιμοποιήσει την εφαρμογή της κίνησης στους δρόμους σε πραγματικό χρόνο.