Ποιες οι τάσεις της τεχνητής νοημοσύνης για τη νέα χρονιά. Το 2023 ήταν γεμάτο από τεχνητή νοημοσύνη. Λίγο η έκρηξη του ChatGPT, λίγοι οι εταιρείες κολοσσοί που ακολούθησαν με τους δικούς τους AI ψηφιακούς βοηθούς, δημιούργησαν την απόλυτη τεχνολογική τάση για την προηγούμενη χρονιά. Απ’ ό,τι φαίνεται όμως η συγκεκριμένη τάση ήρθε για να μείνει. Η GenAI θα συνεχίσει να έχει ανοδική τάση το 2024, ανεβάζοντας μαζί της τα πρότυπα και τις προτεραιότητες της βιομηχανίας δεδομένων.
Ακολουθούν οι 7 κορυφαίες προβλέψεις για το τι μέλλει γενέσθαι για τις ομάδες δεδομένων και AI – και πώς η ομάδα σας μπορεί να παραμείνει ένα βήμα μπροστά.
Τα LLM θα κυριαρχήσουν πλήρως
Αυτό ήταν δεδομένο. Δεν είναι υπερβολή να πούμε ότι τα μεγάλα γλωσσικά μοντέλα (LLM) έχουν μεταμορφώσει το πρόσωπο της τεχνολογίας τους τελευταίους 12 μήνες. Από εταιρείες με νόμιμες περιπτώσεις χρήσης έως μικρές ομάδες, όλοι προσπαθούν να χρησιμοποιήσουν με τον έναν ή τον άλλο τρόπο τη γενετική τεχνητή νοημοσύνη (GenAI).
Τον τελευταίο μήνα μάθαμε ότι η Apple δημιούργησε το δικό της LLM, ακολουθώντας την Google και πλέον φαίνεται ότι η αυτοματοποιημένη ανάλυση και ενεργοποίηση δεδομένων θα γίνει ένα απαραίτητο εργαλείο σε κάθε προϊόν και σε κάθε επίπεδο της στοίβας δεδομένων. Το ερώτημα είναι: πώς μπορούμε να διασφαλίσουμε ότι αυτά τα νέα προϊόντα θα παρέχουν πραγματική αξία το 2024 και όχι απλώς μια μικρή νέα λάμψη για τις εταιρείες τους;
Οι ομάδες λογισμικού θα γίνουν επαγγελματίες δεδομένων
Όταν οι μηχανικοί προσπαθούν να δημιουργήσουν προϊόντα δεδομένων ή GenAI χωρίς να σκέφτονται τα δεδομένα, αυτό δεν έχει καλό τέλος. Καθώς η τεχνητή νοημοσύνη συνεχίζει να κατακτά τον κόσμο, η μηχανική και τα δεδομένα θα γίνουν το ένα και το αυτό. Καμία σημαντική ανάπτυξη λογισμικού δεν θα εισέλθει στην αγορά χωρίς να έχει το βλέμμα προς την AI και καμία σημαντική επένδυση τεχνητής νοημοσύνης δεν θα εισέλθει στην αγορά χωρίς κάποιο επίπεδο πραγματικών επιχειρησιακών δεδομένων που την τροφοδοτούν.
Τα προϊόντα AI θα είναι έτοιμα για επιχειρήσεις
Η τάση της μηχανικής δεδομένων που συνεχίζει να έχει τάση, η οποία δεν είναι άλλη από τα προϊόντα δεδομένων. Αν λοιπόν το 2023 ήταν η χρονιά του AI, το 2024 θα είναι η χρονιά της λειτουργικότητας των προϊόντων AI.
Είτε από ανάγκη είτε από εξαναγκασμό, οι ομάδες δεδομένων σε όλους τους κλάδους θα αγκαλιάσουν τα AI προϊόντα. Το ερώτημα που προκύπτει είναι το εάν θα είναι πραγματικά έτοιμα για επιχειρήσεις. Και όχι, δεν εννοούμε απλά για ένα προσωπικό βοηθό που θα απαντά σε ερωτήσεις.
Η ποιότητα των δεδομένων θα είναι το παν
Στην έρευνα 2023 CDO Insights της Amazon Web Services (AWS), οι συμμετέχοντες ρωτήθηκαν ποια είναι η μεγαλύτερη πρόκληση του οργανισμού τους για την αξιοποίηση των δυνατοτήτων της δημιουργικής τεχνητής νοημοσύνης. Η πιο κοινή απάντηση δεν ήταν άλλη από την ποιότητα των δεδομένων.
Η δημιουργική τεχνητή νοημοσύνη είναι, στον πυρήνα της, ένα προϊόν δεδομένων. Και όπως κάθε προϊόν δεδομένων που σέβεται τον εαυτό του, δεν μπορεί να λειτουργεί χωρίς αξιόπιστα δεδομένα. Αλλά στην κλίμακα των LLM, η χειροκίνητη παρακολούθηση δεν μπορεί να παρέχει την ολοκληρωμένη και αποτελεσματική ποιοτική κάλυψη που απαιτείται για να καταστεί αξιόπιστη οποιαδήποτε τεχνητή νοημοσύνη.
Για να είναι πραγματικά επιτυχημένες, οι ομάδες δεδομένων χρειάζονται μια ζωντανή, αναπνέουσα στρατηγική παρατηρησιμότητας δεδομένων, η οποία μπορεί να τους δώσει τη δυνατότητα να εντοπίζουν, να επιλύουν και να αποτρέπουν με συνέπεια τη διακοπή λειτουργίας των δεδομένων στο πλαίσιο ενός αναπτυσσόμενου και δυναμικού περιβάλλοντος. Και, αυτές οι λύσεις πρέπει να δίνουν προτεραιότητα στην επίλυση, την αποδοτικότητα και τις υποδομές ροής που υποστηρίζουν το AI, προκειμένου να είναι διεκδικητές στη σύγχρονη μάχη για την αξιοπιστία του AI το 2024.
Το σωστό μέγεθος θα έχει προτεραιότητα
Οι σημερινοί ηγέτες δεδομένων βρίσκονται αντιμέτωποι με ένα αδύνατο έργο. Να χρησιμοποιούν περισσότερα δεδομένα, να δημιουργούν μεγαλύτερο αντίκτυπο, να αξιοποιούν περισσότερη τεχνητή νοημοσύνη, αλλά να μειώνουν αυτά τα κόστη cloud.
Όπως το θέτει το Harvard Business Review, οι επικεφαλής δεδομένων και ΑΙ είναι προετοιμασμένοι για να αποτύχουν. Από το πρώτο τρίμηνο του 2023, η IDC αναφέρει ότι οι δαπάνες για υποδομές cloud αυξήθηκαν σε 21,5 δισεκατομμύρια δολάρια. Σύμφωνα με τη McKinsey, πολλές εταιρείες βλέπουν τις δαπάνες για το cloud να αυξάνονται έως και 30% κάθε χρόνο.
Προσεγγίσεις με χαμηλό αντίκτυπο, όπως η παρακολούθηση μεταδεδομένων και τα εργαλεία που επιτρέπουν στις ομάδες να βλέπουν και να διαμορφώνουν σωστά τη χρήση, θα είναι ανεκτίμητες το 2024.
Επιστροφή στο γραφείο
Ενώ οι περισσότερες ομάδες εργασίας δεδομέων και AI φαίνεται να είναι διχασμένες ως προς το θέμα, όλο και περισσότερες καλούνται να επιστρέψουν στο γραφείο τους και στο θάλαμο εργασίας για τουλάχιστον δύο ημέρες την εβδομάδα. Σύμφωνα με μια έκθεση του Σεπτεμβρίου 2023 από το Resume Builder, το 90% των εταιρειών σχεδιάζουν να επιβάλουν πολιτικές επιστροφής στο γραφείο μέχρι το τέλος του 2024, σχεδόν τέσσερα χρόνια μετά από εκείνη τη μοιραία άνοιξη του 2020.
Στην πραγματικότητα, αρκετοί ισχυροί διευθύνοντες σύμβουλοι – όπως ο Andy Jassy της Amazon, ο Sam Altman της OpenAI και ο Sundar Pichai της Google έχουν ήδη θέσει σε ισχύ πολιτικές επιστροφής στο γραφείο τους τελευταίους μήνες. Και φαίνεται να υπάρχουν τουλάχιστον κάποια πλεονεκτήματα από την εργασία σε γραφείο τουλάχιστον με μερική απασχόληση σε σχέση με την εργασία αποκλειστικά από το σπίτι.
Το παγόβουνο θα αυξηθεί (Apache Iceberg)
Το Apache Iceberg είναι μια μορφή πίνακα δεδομένων ανοικτού κώδικα που αναπτύχθηκε από την ομάδα μηχανικών δεδομένων του Netflix για να παρέχει έναν ταχύτερο και ευκολότερο τρόπο επεξεργασίας μεγάλων συνόλων δεδομένων σε κλίμακα. Έχει σχεδιαστεί ώστε να είναι εύκολα επεξεργάσιμο με SQL ακόμη και για μεγάλους αναλυτικούς πίνακες με petabytes δεδομένων.
Εκεί που οι σύγχρονες αποθήκες δεδομένων θα προσφέρουν τόσο υπολογισμό όσο και αποθήκευση, το Iceberg επικεντρώνεται στην παροχή οικονομικά αποδοτικής, δομημένης αποθήκευσης στην οποία μπορούν να έχουν πρόσβαση πολλές διαφορετικές μηχανές που μπορεί να αξιοποιούνται ταυτόχρονα σε ολόκληρο τον οργανισμό σας, όπως οι Apache Spark, Trino, Apache Flink, Presto, Apache Hive και Impala. Πρόσφατα, η Databricks ανακοίνωσε ότι τα μεταδεδομένα των πινάκων Delta θα είναι επίσης συμβατά με τη μορφή παγόβουνου.